小米在人工智能领域再次取得重大突破,正式推出面向智能体(Agent)时代的旗舰基座模型Xiaomi MiMo-V2-Pro,同时发布全模态基座模型Xiaomi MiMo-V2-Omni和语音合成模型Xiaomi MiMo-V2-TTS。据雷军在微博透露,这款万亿参数大模型Mimo-V2-Pro已跻身全球大模型综合智能排行榜Artificial Analysis第八位,按品牌排名则位列全球第五,超越了xAI Grok等竞争对手。他强调,小米在AI领域的实际进展远超外界想象,仅2024年研发和资本投入就将超过160亿元。
此前,两个未署名的匿名模型Hunter Alpha和Healer Alpha悄然登陆知名API聚合平台OpenRouter,在几乎零宣传的情况下调用量持续飙升。其中,Hunter Alpha多次登顶日榜,累计调用量突破1T tokens,其卓越表现引发外界猜测,甚至被误认为是DeepSeek V4的内测版本。最终揭晓答案:这两个模型均来自小米。OpenClaw创始人Peter Steinberger还曾在社交平台X上公开打听它们的身份,这一插曲为小米的AI布局增添了几分神秘色彩。
小米大模型团队负责人罗福莉在社交媒体发文称,这是为Agent时代量身打造的首个全栈模型家族。她坦言,从传统聊天模式向Agent范式的转变速度之快令人意外,团队在研发过程中经历了“兴奋、痛苦与迷人交织”的过程。为推动团队适应复杂的代理式架构,她甚至立下严苛要求:MiMo团队中对话少于100次的成员可自行离职。这一言论引发行业关注,前阿里千问技术负责人林俊旸评论称“very impressive”。
据技术团队披露,MiMo-V2-Pro通过扩大参数规模和算力投入,构建了更强大的模型基座。其总参数量突破1T(激活参数42B),是前代MiMo-V2-Flash的3倍。模型沿用创新的Hybrid Attention机制,混合比例从5:1提升至7:1,在参数量激增的同时仍保持较高推理效率,并支持1M超长上下文。轻量MTP层设计显著提升了生成速度。在多项基准测评中,该模型在Coding Agent、通用Agent和Tool Use等场景的表现与Claude Sonnet 4.6、GPT 5.2、Gemini 3.0 Pro处于同一梯队。
作为专为Agent场景优化的模型,MiMo-V2-Pro针对复杂Agent框架进行了深度强化训练,具备更强的工具调用与多步推理能力。在通用智能体框架OpenClaw的标准评测榜单PinchBench和Claweval上,其表现位居全球顶尖行列。小米表示,底层模型的能力上限直接决定了Agent系统的业务表现,而MiMo-V2-Pro的推出将显著提升此类框架的实用性。
在商业化方面,MiMo-V2-Pro采用分段计价模式:256K上下文以内输入1美元/百万tokens,输出3美元/百万tokens;1M上下文以内输入2美元/百万tokens,输出6美元/百万tokens。与此同时,小米在官方体验页面上线了MiMo Claw模块,用户可免费体验MiMo-V2-Pro的核心功能。该模块已全面接入金山WebOffice生态,支持Word、Excel、PPT、PDF四大主流格式,覆盖超95%的日常文档类型。小米浏览器也已完成与MiMo-V2-Pro的整合,进一步拓展AI搜索的应用场景。