巨人天成
产经 科技 企业 数据 峰会 快讯 商业

蚂蚁集团发布万亿参数思考模型Ring-2.5-1T 破解深度思考模型效率难题

2026-02-14来源:快讯编辑:瑞雪

深度思考模型长期面临一个棘手的挑战:若要实现严密的逻辑推理,往往需要牺牲解码速度,同时承受巨大的显存消耗。这一困境如同“不可能三角”,制约着模型性能的进一步提升。为突破这一瓶颈,行业普遍采用混合专家模型(MoE)架构,通过部分参数激活来降低算力需求,DeepSeek、Kimi、MiniMax等头部模型均沿用了这一路径。

近日,蚂蚁集团宣布开源全球首个基于混合线性架构的万亿参数思考模型——Ring-2.5-1T。该模型通过架构创新,首次同时实现了推理速度、深度思考能力与长程任务执行效率的协同优化。在数学竞赛评测中,Ring-2.5-1T以IMO金牌级35分(满分42)和CMO 105分(远超国家集训队分数线)的成绩证明其逻辑严谨性;在32K以上长文本生成场景中,其访存规模较上一代降低90%,生成吞吐量提升超3倍,为搜索、编码等复杂任务提供了高效解决方案。

Ring-2.5-1T的核心优势源于其底层架构的突破性设计。该模型基于Ling 2.5架构,采用混合线性注意力机制,将MLA(多头潜在注意力)与Lightning Linear Attention以1:7的比例融合。这一设计源自蚂蚁此前发布的Ring-flash-linear-2.0技术路线,通过增量训练将原有GQA(分组查询注意力)层转化为两种注意力模块:Lightning Linear Attention负责长程推理中的吞吐量提升,MLA则极致压缩KV Cache以减少显存占用。为弥补架构改造可能导致的表达能力损失,研发团队引入了QK Norm和Partial RoPE等特性,使激活参数量从上一代的51B提升至63B,同时凭借线性时间复杂度特性,推理效率实现质的飞跃。与同参数量级但仅32B激活参数的Kimi K2架构相比,Ling 2.5架构在长序列任务中的吞吐优势随生成长度增加持续扩大,彻底改变了长程推理“高成本、低效率”的行业现状。

逻辑严谨性是深度思考模型的另一大核心指标。Ring-2.5-1T在训练阶段引入密集奖励机制,突破传统强化学习仅关注最终答案正确性的局限,通过逐步考察推理过程的每个环节,显著提升模型对逻辑漏洞的识别能力与高阶证明技巧的运用水平。团队采用大规模全异步Agentic RL训练方法,增强模型在搜索、编码等长链条任务中的自主执行能力,使其从“数学解题专家”进化为“复杂场景智能体”。

在基准测试中,Ring-2.5-1T与DeepSeek-v3.2-Thinking、Kimi-K2.5-Thinking等开源模型,以及GPT-5.2-thinking-high、Gemini-3.0-Pro-preview-thinking-high等闭源API展开全面对比。结果显示,该模型在IMOAnswerBench、AIME 26等高难度推理任务,以及Gaia2-search、Tau2-bench等长时任务执行基准上均达到开源最优水平。在Heavy Thinking模式下,其数学竞赛与代码生成能力更超越所有对比模型,包括闭源API。以IMO 2025为例,Ring-2.5-1T以35分斩获金牌,CMO 2025则以105分远超金牌线78分与国家集训队选拔线87分,较上一代Ring-1T在推理严谨性、证明技巧运用与答案完整性上均有显著提升。

为推动技术生态落地,Ring-2.5-1T已完成对Claude Code、OpenClaw等主流智能体框架的适配,支持多步规划与工具调用。目前,模型权重与推理代码已在Hugging Face、ModelScope等平台开放下载,官方Chat体验页与API服务即将上线。同期,蚂蚁集团还发布了扩散语言模型LLaDA2.1与全模态大模型Ming-flash-omni-2.0:前者采用非自回归并行解码技术,推理速度达535 tokens/s,在Humaneval+编程任务中突破892 tokens/s,并具备Token编辑与逆向推理能力;后者则实现视觉、音频、文本的统一表征与生成,支持实时感官交互,为多模态创作提供底层能力支撑。蚂蚁inclusionAI团队表示,将持续聚焦视频时序理解、复杂图像编辑与长音频实时生成等技术方向,推动全模态能力的规模化应用。

随着AI应用场景从短对话向长文档处理、跨文件代码理解与复杂任务规划延伸,深度思考模型的效率瓶颈日益凸显。Ring-2.5-1T通过架构重构,为行业提供了一条兼顾性能、成本与扩展性的技术路径。当“高速、精准、深度”不再相互制约,深度思考模型的应用边界正被重新定义。

2月14日香港湾仔海滨:2026架无人机点亮夜空 共迎马年新春
2月14日,由2026架无人机呈现的大型无人机表演在香港湾仔海滨闪亮登场,为即将到来的马年新春增添喜庆祥和的节日气氛。2月14日,人们在香港湾仔海滨观看、拍摄无人机表演。 2月14日,人们在香港湾仔海滨观…

2026-02-14

机器人春节“打工”热:租赁订单破千 价格回落后行业探索新路径
从“天价租金”到“回本压力”显现,许多从业者开始寻找更多应用场景,行业也尝试通过平台化轻资产模式重构生态。2月开始,徐先生公司的订单就没有停过,业务应接不暇,每次也要派出一名操作员和一名安全员共同保证订单的服…

2026-02-14

智元发布全尺寸人形机器人远征A3,2026年量产,商业化进程加速
界面新闻记者 | 徐美慧 界面新闻记者从行业人士处独家获悉,远征A3计划将于2026年内量产。 智元机器人政府事务总监朱洁此前在接受界面新闻记者采访时表示,截至2025年底,智元机器人整体出货量超过5100…

2026-02-14

春节前夕字节再发力,豆包大模型2.0升级,推理代码能力双提升
2月14日,这股大模型“井喷”潮迎来高峰:字节在连续发布Seedance 2.0视频模型、Seedream 5.0 Lite图像模型之后,官宣推出豆包大模型2.0(Doubao-Seed-2.0)系列。贝壳…

2026-02-14