
界面新闻记者 | 宋佳楠开yun体育网
2月18日午间,马斯克旗下xAI公司的新一代大模子Grok 3崇敬发布。发布会遴荐视频直播神志,不雅看东谈主数跨越100万东谈主,马斯克本东谈主也出面前直播间。
据马斯克先容,Grok3在很短的本事内竣事了功能比Grok2精深一个数目级,Grok-3和Grok-3 mini在多方面性能上王人跨越或失色Gemini、DeepSeek和ChatGPT等敌手。
xAI工程师则暗示,诚然Grok起步较晚,但在MMLU得分上以超快的速率追上了ChatGPT,Grok 3所触及的训练是Grok 2的10倍,面前Grok 3也曾在xAI里面开动了2周。MMLU是一个用于评估言语模子在多种任务上言语康健才智的基准测试。
此外,xAI推出名为Deepsearch的Grok-3智能搜索引擎。xAI工程师强调,Deepsearch是xAI的第一代无为代理用具,它不仅匡助工程师、相关东谈主员和科学家编写代码,也能匡助每个东谈主回复广泛碰到的问题。
马斯克在现场演示了Grok 3的搜索才智,如问“下一次的星舰辐照是什么时候”,Grok 3会像DeepSeek雷同,炫夸模子正在作念什么,包括浏览的网页、想考的经过,并阐明网页上的信息是否真正,再得出一个干系的论断。最终,大模子以列表神志瞻望了下一次星舰的辐照期。
值得看重的是,该搜索引擎在深度想考经过中还会炫夸不同的次任务,这种功能据称比面前的搜索引擎更为精深,可省俭更多本事,因对搜索引擎的算法和逻辑重新进行了臆想打算。
关于用户何时不错体验到“地球上最智慧的东谈主工智能”,马斯克称会领先向预定用户盛开。由于模子仍在握住更新和变调中,苹果运用商店上线的Grok版块会相对过时,而网页版更新最为实时。据其透露,Grok 3语音形状可能在一周后推出。
直播末尾,马斯克和xAI工程师现场回复了网友发问。当被问及是否会开源时,马斯克给出了治服的谜底,称每次作念下一个版块时会开源上一个版块,几个月后会开源Grok 3。关于颇为敏锐的“Grok 3是男性照旧女性”问题,马斯克称,性别是模子我方界说的,还请示“不要爱上Grok”。
谈及开发Grok 3最难的部分,马斯克暗示是训练模子和100%的逻辑推理经过,那种复杂进程就像随处随时瞻望宇宙的发展情况。
若是Grok 3的推理才智真如视频中所讲的那样精深,可能鼓吹AI从 “生成谜底” 向 “逻辑推导” 升级。
xAI公司拓荒于2023年7月,此前已推出过Grok-1、Grok-1.5、Grok-1.5 Vision、Grok-2等大模子居品。其中,Grok-1是迄今参数目最大的开源大言语模子;Grok-1.5具有变调的推理才智和128k的凹凸文长度;Grok-1.5 Vision是首个多模态智能模子;Grok-2在Chatbot Arena榜单排行第18位。
不外,面前大模子行业竞争态势无比浓烈。在Grok 3发布当日,奥特曼在X上暗示,“关于高条目的测试者来说,试用GPT-4.5带来的感受AGI的体验,远比我预期的要潜入得多!”这似乎在预示着,GPT-4.5也曾参加测试阶段,距离崇敬发布也不会太远了。
而在2月初,谷歌也发布了一系列新模子,包括Gemini 2.0 Flash、Gemini 2.0 Flash-Lite以及新一代旗舰大模子Gemini 2.0 Pro践诺版块。Grok 3能否占据主导地位还需进一步不雅察。
不错细则的是,包括OpenAI、谷歌等AI巨头在内,近期王人已感受到了来自中国大模子公司DeepSeek带来的冲击波,以往坚抓闭源的OpenAI也有了进一步开源的迹象。2月18日,奥特曼在X上发起投票,问大家但愿下一个OpenAI开源的大模子是哪种?是o3-mini照旧手机上可开动的大模子?或是在为开源某个大模子作念预热。
海量资讯、精确解读,尽在新浪财经APP
牵累裁剪:于健 SF069开yun体育网
