巨人天成
产经 科技 企业 数据 峰会 快讯 商业

马斯克xAI再发力:Grok 4.1发布,情商智商双提升,团队引关注

2025-11-20来源:快讯编辑:瑞雪

马斯克旗下人工智能公司xAI近日推出全新大模型Grok 4.1,以"双商在线"为卖点,直接对标尚未正式发布的GPT-5.1。这款模型分为Thinking(推理版)和标准版两个版本,现已在Grok官网、X平台及移动端应用全面开放免费体验。

在权威评测平台LMArena的最新榜单中,Grok 4.1 Thinking以1483分登顶全球大模型排行榜,较第二名Gemini 2.5 Pro高出31分。其标准版同样表现强劲,直接占据榜单次席。更引人注目的是情商测试EQ-Bench3的结果:Thinking版以1586分刷新纪录,标准版紧随其后,国产模型Kimi K2位列第三。

实测体验显示,新模型在交互方式上发生显著变化。相比前代产品,Grok 4.1展现出更强的共情能力,回复结尾会主动添加爱心符号,被用户形容为"更有耐心的倾听者"。其创意写作能力提升尤为突出,评分较前代激增600分,文本生成更具画面感和叙事性。同时,模型幻觉率从12.09%大幅降至4.22%,信息准确性显著改善。

技术突破源于强化学习框架的全面升级。xAI后训练负责人Dustin Tran透露,团队在支撑前代模型的基础设施上,通过优化模型风格特征和个性表达,开发出利用智能体推理模型作为奖励机制的新方法。这种自主评估体系使大规模迭代响应成为可能,强化学习规模较前代扩大10倍。

团队构成成为另一关注焦点。近期流传的xAI合影显示,核心研发团队以亚裔面孔为主,有消息称原Grok团队白人成员已全部离职。这种人员调整被外界解读为马斯克的人才战略转型,但公司尚未对此作出正式回应。

关于备受期待的Grok 5,马斯克在最新访谈中透露,这款预计参数规模达6万亿的模型将推迟至明年发布。他解释称,作为迈向通用人工智能的关键里程碑,Grok 5需要前所未有的计算资源支持,目前仍在进行极其严格的测试验证。这与此前报道中提到的资源限制和测试难度问题形成呼应。

行业观察人士指出,Grok 4.1的发布既是技术迭代的成果展示,也暗含马斯克构建AI生态的深层布局。不过随着谷歌Gemini 3.0等竞品即将入场,大模型领域的竞争格局仍存在变数。这场由科技巨头主导的AI竞赛,正在持续改写人工智能技术的发展轨迹。

光伏气象站:光伏电站的“智慧大脑”,精准监测助力高效发电与运维
从应用场景来看,光伏气象站可全方位适配各类光伏电站:大型地面光伏电站可通过多监测点组网,实现全域气象数据覆盖,为电站布局优化(如根据辐射分布调整组件密度)、发电量预测提供数据支撑;分布式光伏电站(如屋顶光伏…

2025-11-19

华为MatePad Edge鸿蒙二合一平板登场,开启智能设备融合新体验
11月19日,在华为鸿蒙办公新品技术沟通会上,首款鸿蒙二合一平板电脑——华为MatePad Edge正式亮相。华为MatePad Edge以系统级融合能力打破设备边界,以“巨幕平板”的视听体验与“性能电脑”的…

2025-11-19

鸿蒙赋能华为MatePad Edge登场,以生态融合重塑二合一设备新体验
在平板模式下,它是拥有极致触控体验的移动娱乐终端;而在需要处理复杂工作时,通过简单的四指一划,即可无缝切换至电脑模式,接入鸿蒙电脑办公生态。 沟通会上,华为终端平板与PC产品线总裁朱懂东还指出,目前鸿蒙电脑已…

2025-11-19

华为MatePad Edge登场:创新形态融合生态,引领二合一平板新潮流
不同于传统产品只是物理形态的结合,华为MatePad Edge在系统层面打通了平板与电脑两种使用模式,让用户可以根据场景需求无缝切换,获得各自场景下的最佳体验。通过双模式设计,这款产品将鸿蒙平板生态与鸿蒙电脑…

2025-11-19