巨人天成
产经 科技 企业 数据 峰会 快讯 商业

Gemini 3正式登场:多模态推理霸榜,AI新格局或将重塑

2025-12-03来源:快讯编辑:瑞雪

谷歌最新发布的Gemini 3智能模型引发全球科技界震动。这款被定义为"通往AGI重要一步"的模型,在发布前就因开发者负责人一条仅含"Gemini"的推文引爆社交媒体,甚至导致推特平台多次出现访问故障。尽管Cloudflare事后澄清故障原因,但网友仍戏称这是"史上最成功的模型预热"。

在基准测试中,Gemini 3 Pro以1501分的Elo评分登顶LMArena排行榜,在Humanity's Last Exam(37.5%)和GPQA Diamond(91.9%)等核心指标上全面超越前代及Claude、GPT等竞品。数学能力方面,该模型在MathArena Apex取得23.4%的突破性成绩,重新定义了前沿模型的标准。多模态处理能力同样惊艳,在解析科学图表和视频流的任务中分别获得81%和87.6%的高分,事实准确性指标SimpleQA Verified更达到72.1%。

深度思考模式(Deep Think)的推出成为最大亮点。测试数据显示,该模式在Humanity's Last Exam(41.0%)和GPQA Diamond(93.8%)的表现优于基础版,在代码执行测试ARC-AGI-2中取得45.1%的得分。这种能力提升使模型能自主规划复杂任务,例如在模拟售货机经营测试中,通过长周期管理实现更高投资回报,全程保持决策连贯性。

开发者生态迎来重大革新。新推出的Google Antigravity平台将智能体开发提升至新维度,开发者可授权AI自主操作编辑器、终端和浏览器。该平台整合了Gemini 2.5 Computer Use浏览器控制模型和Nano Banana图像编辑模型,形成完整的开发工具链。在WebDev Arena测试中,Gemini 3以1487分领跑,Terminal-Bench 2.0测试取得54.2%的成绩,编码代理性能测试SWE-bench Verified得分达76.2%。

实际应用场景展现惊人潜力。用户上传匹克球比赛视频后,模型能分析技术缺陷并制定训练计划;学习复杂科学概念时,可生成交互式记忆卡片和可视化代码;烹饪爱好者能通过翻译手写食谱,生成多语言数字版本。搜索中的AI模式引入沉浸式视觉布局,用户查询RNA聚合酶工作原理时,系统会即时生成动态模拟界面。

定价策略采用分级模式,200k tokens以下任务输入/输出价格为每百万token 2美元/12美元,超过部分则升至4美元/18美元。深度思考模式将作为Google AI Ultra订阅专属功能,预计未来几周内上线。技术细节显示,这个基于MoE架构的模型使用TPU从头训练,具备1M输入和64k token输出能力。

市场反应印证行业期待。在X平台发起的"2026年最佳大模型"投票中,Gemini系列获得压倒性支持。官方数据显示,AI Overviews月活用户达20亿,Gemini应用突破6.5亿月活,云客户中超70%使用其生成式模型,开发者数量突破1300万。这场始于Bard仓促发布的转型,经过合并DeepMind、召回创始人等重大调整,正显现出战略成效。

小米公益基金会捐赠5500万助力光华工程科技奖 推动科技发展与人才培养
【CNMO科技消息】11月25日,小米官方宣布旗下公益基金会向中国工程界最高奖项——光华工程科技奖,捐赠5500万元。 值得一提的是,在7月29日,小米公益基金会为应对华北地区强降雨引发的洪涝和地质灾害,捐赠…

2025-12-03

小米机器人团队扩张进行时:前特斯拉工程师卢泽宇加盟,高薪揽才引关注
11月26日,曾参与特斯拉Optimus灵巧手研发的工程师卢泽宇,在社交平台公开宣布加入小米机器人团队,并担任“灵巧手负责人”。今年以来,小米在具身智能领域动作频密:既开源了MiMo-Embodied大模型…

2025-12-03

马斯克欲将X打造成多功能“超级应用” 借鉴微信模式拓展服务版图
据Economic Times报道,在和Zerodha联合创始人尼基尔·卡马斯(NikhilKamath)的对话中,特斯拉首席执行官埃隆·马斯克(Elon Musk)再次明确表示,想要把社交平台X打造成中国…

2025-12-03