北京时间18日中午,美国企业家埃隆·马斯克创办的人工智能公司xAI推出了新一代AI模型Grok 3,马斯克称其“聪明得可怕”。Grok 3拥有更高的推理、计算和适应能力,代表着AI模型向前迈出重要一步。
马斯克在直播演讲中表示:“Grok 3的能力比Grok 2高出一个数量级,它是一种最大程度寻求真相的人工智能。”
xAI公司称,Grok 3在包括AIME和GPQA(博士专家水平的物理、生物和化学问题评估模型)在内的基准测试中胜过了GPT-4o。
更准确地说,Grok 3代表一个模型系列,而非单一的模型型号。xAI公司表示,Grok 3的推理模型处于测试阶段,并且仍在训练中。该公司推出了推理模型的迷你版本,即Grok 3 mini,它可以更快地回答问题,但准确性可能不高。
此外,Grok 3还引入了“DeepSearch”,该公司称其为一种新型搜索引擎,同时也是类似代理功能的早期版本。
原计划在此次发布中推出的语音模式并未如期上线,马斯克称其最快将在大约一周后推出。几个月后,当Grok 3模型成熟之时,xAI将开源Grok 2。
据xAI此前报告称,其仅用8个月时间打造的Colossus超级计算机加速了Grok 3的开发进程。该系统搭载了10万台英伟达H100 GPU,提供了2亿GPU小时的训练时长,相较其前身Grok 2提升了10倍。算力的显著提升使Grok 3能高效处理大型数据集,缩短训练时间并提高准确性。xAI还表示,已在Grok 3中引入人类反馈循环和情境训练,从而确保其回答更加自然和准确。
为了增强Grok 3的能力,xAI还调整了训练方法。现在,该模型通过整合合成数据集、引入自我校正机制和强化学习,来全面提升性能表现。据xAI方面和马斯克介绍,这些改进将通过多重验证步骤减少错误回答,通过核对可靠信息源来提高逻辑准确性,并通过持续自我评价和学习实现更有效的适应。
声明:本网转发此文章,旨在为读者提供更多信息资讯,所涉内容不构成投资、消费建议。文章事实如有疑问,请与有关方核实,文章观点非本网观点,仅供读者参考。
一、前言:新KB5041587补丁到底可以提升多少游戏性能!Zen5可以说是AMD多年来底层架构变化最大的处理器。根据AMD的说法,在制程工艺不变的情况,IPC提升幅度接近20%,游戏帧率也有10%左右的提升。不过等到锐龙9000处理器正式...
继广州车展正式上市后,红旗金葵花国雅的区域上市陆续进行,这次来到了北京。早在今年4月的北京车展上,红旗汽车发布了全新品牌——金葵花,并带来四款“国字号”产品:国礼、国雅、国耀、国悦,其中作为国产顶尖大型豪华轿车的金葵花国雅备受瞩目。随后在1...
一、前言:花10万块买一台手机值吗?在这篇评测接近完稿的时候,我瞅了一眼华为官网的预约人数,已经超过了685万人。早先供应链多个渠道透露,华为MateXT非凡大师的备货量大约为100万台(首批)。这也意味着,9月20日10:08分正式开售之...
一、前言:机械硬盘在电脑中还有位置吗?如今的笔记本几乎全部默认预装SSD,大多数人装机也首选SSD,但对于有着大容量数据、稳健存储需求的用户而言,一块大容量机械硬盘仍是第一选择,毕竟其单位容量的成本远低于SSD。如今的SSD主流容量才1-2...
一、前言:能效为王的酷睿Ultra200V系列处理器ARM平台的功耗远低于X86平台,ARM处理器笔记本(比如MacBookAir)的续航远高于X86+Windows笔记本!在我们看来,这些似乎就是理所当然、天经地义的事情,毕竟几十来年一直...
一、前言:性能全面领先的国产企业级PCIe5.0SSD一年前,我们曾测试过忆恒创源PBlaze779406.4TB,它是当时最强的企业级PCIe5.0SSD,不仅率先实现了10GB/s的顺序写性能,高达14GB/s的顺序读取速度也几乎完全榨...