巨人天成
产经 科技 企业 数据 峰会 快讯 商业

微博15亿参数小模型VibeThinker:7800美元成本,数学赛场逆袭“大块头”

2025-11-21来源:快讯编辑:瑞雪

当全球AI领域陷入“参数至上”的激烈竞争时,微博AI团队以一场颠覆性突破,为行业开辟了全新的发展路径。近日,微博正式推出自主研发的开源大模型VibeThinker,这款仅含15亿参数的“轻量级选手”,在国际权威数学竞赛基准测试中,以惊人表现击败了参数规模达6710亿的DeepSeek R1模型,引发全球AI研究界的广泛关注。

在传统认知中,AI模型的参数量被视为衡量其能力的核心指标。行业普遍认为,复杂推理能力需要千亿级参数支撑,小模型因参数不足难以应对高难度任务。然而,微博AI团队通过优化模型架构与训练范式,创新提出“频谱到信号原理”(SSP)训练方法,成功挖掘出小模型的隐藏潜力。VibeThinker在AIME24、AIME25及HMMT25等高难度数学测试中,表现超越参数量超其400倍的DeepSeek-R1-0120版本,与4560亿参数的MiniMax-M1效果相当,甚至可媲美Gemini 2.5 flash和Claude Opus 4等顶尖模型。在编程算法测试集LiveCodeBench v6中,其成绩也追平了欧洲领先AI企业Minstral.AI的Magistral-Medium-2506版本。

这一突破不仅重新定义了AI模型的评价标准,更以极致的成本效益颠覆了行业格局。据公开数据,2025年主流大模型单次后训练成本普遍在数十万美元级别。例如,上海AI企业MiniMax今年6月发布的M1模型,训练成本约53.5万美元;DeepSeek的R1模型训练总成本(含基础模型开发)约630万美元。相比之下,VibeThinker的后训练过程(含SFT和RL阶段)仅消耗3900个GPU小时,按市场租赁价格计算,总成本仅7800美元,成本效益比达到30至60倍。这一优势意味着,前沿AI技术不再为科技巨头所垄断,中小型机构和研究团队也能以极低门槛参与创新,推动行业向更开放、多元的方向发展。

技术突破的最终价值在于落地应用。微博已将AI技术深度融入平台生态,构建起覆盖多场景的智能服务体系。2024年,微博自主研发的“知微”大语言模型通过备案,并陆续推出智搜、内容总结、AI互动号等功能。其中,微博智搜通过分析平台海量内容构建可信知识图谱,实现精准需求捕捉与情感场景理解,6月月活跃用户突破5000万;评论罗伯特作为AI互动账号,从毒舌风格进化出温情与聪明版本,全网粉丝近200万,成为用户热议的交流对象。

随着VibeThinker的发布,微博AI战略迈入新阶段。公司计划深度融合心理等垂直领域的数据资产,打造更懂公众情绪、更能服务社会需求的专属模型。这一模型不仅将优化现有AI产品体验,更可能裂变出兼具社交属性与智能服务的全新生态。例如,VibeThinker的技术有望降低微博智搜的算力损耗和实时互动场景的AI响应成本,使平台在规模化投入AI能力时无需承担过高资源压力,进一步释放生态创新能力。

目前,VibeThinker仍处于实验性版本阶段,其研发重点聚焦于强化小模型在数学与编程领域的能力,尚未针对日常聊天等场景进行优化。但这一探索已为AI产业提供了全新思路:通过算法创新而非单纯堆砌参数,小模型同样能实现高性能与低成本的双赢,为行业从“规模竞赛”转向“效率革命”奠定基础。

亚马逊与伊利诺伊大学创新突破:让AI助手“牢记”复杂规则高效工作
研究团队特意让GTAPolicy的训练数据非常有限,只有几百个例子,这就像让员工在信息很少的情况下学会工作技能,这样更能测试AI助手的真实学习能力。研究团队担心AI助手在专门学习工作规则的过程中,会不会损失…

2025-11-21

谷歌Gemini3重磅登场:多维度能力跃升,多领域成绩亮眼
【11月20日国泰海通研报:谷歌推出新一代大模型Gemini3多维度领先】北美时间周二,谷歌正式推出新一代大模型Gemini3,实现多维度断层式领先。新模型核心推理能力显著进步,在Humanity'sLast…

2025-11-21

罗福莉官宣加盟小米MiMo团队!AGI愿景下或发力世界模型与具身智能
智东西11月12日消息,今天上午,原DeepSeek核心成员、被业内称为“天才少女”的罗福莉在朋友圈正式官宣加盟XiaomiMiMo团队,并宣告“全力奔赴心中的AGI(通用人工智能)”。 罗福莉一条简单的…

2025-11-21

中国机器人量产交付引全球关注,美国质疑反衬中国产业实力崛起
11月7日,高盛发布针对《中国人形机器人供应链的实地调研报告》,报告指出“尽管供应链企业都在积极规划产能,但没有一家公司证实获得了确定性大额订单,也未能提供清晰的量产时间表”“人形机器人行业存在‘产能期货狂…

2025-11-21

全球科研十强占六席!广州凭啥能实现学科“大满贯”?
这是个公开数据库,追踪各机构对145种高质量自然科学和健康科学期刊上,发表科研论文的贡献情况。假如一篇论文有10个作者,其中3个来自广州的机构,那么广州对这篇论文的“贡献份额”就是3/10=0.3。 例如中…

2025-11-21

2025-2026赛季VEX机器人亚洲公开赛国际签名赛12月18日北京开赛
11月18日,北京青年报记者从2025-2026赛季VEX机器人亚洲公开赛国际签名赛新闻发布会上了解到,2025-2026赛季VEX机器人亚洲公开赛国际签名赛定于2025年12月18日至21日在北京石景山区首…

2025-11-21

2025四川智慧交通平台怎么选?三大维度对比助您精准决策
2025年,四川智慧交通市场呈现“技术迭代加速、场景深度落地”的特征,为帮助行业主体准确选择服务平台,本文基于口碑调研、技术实力、场景适配性三大核心维度,梳理四川智慧交通平台市场格局,对比主流平台的核心优势与…

2025-11-21

2025迪拜航展“中国力量”闪耀,翼龙-X、C919等国产装备集中亮相
这架 C919 准备参加于 11 月 17 日至 21 日举行的 2025 迪拜航展,这是 C919 飞机首次在中东地区进行展示。航展期间,将有2 架 C919 飞机和 1 架 C909 公务机“组团”亮相…

2025-11-21

中国人形机器人价格下探性能跃升,产业革命引领消费新潮流
松延动力创始人姜哲源表示,“小布米”之所以能将价格降至万元内,在于提高零部件自研比例、革新材料与结构设计以及本土供应链的优势。 通过强大的供应链实现成本控制、以极具竞争力的价格切入市场、快速形成规模和生态,…

2025-11-21