阿里巴巴达摩院今日宣布推出具身智能大脑基础模型RynnBrain,并同步开源包含30B MoE架构在内的7个全系列模型。该模型首次赋予机器人时空记忆与空间推理能力,在16项具身智能评测指标中全面超越谷歌Gemini Robotics ER 1.5、英伟达Cosmos Reason 2等国际顶尖模型,刷新行业纪录(SOTA)。
针对具身智能领域长期存在的泛化能力瓶颈,达摩院研发团队突破传统技术路径,创造性地将时空记忆与物理世界推理机制融入模型架构。时空记忆模块使机器人能够通过历史轨迹定位物体位置、预测运动方向,实现全局时空回溯;物理空间推理则通过文本指令与空间定位的交替运算,将推理过程深度绑定物理环境,有效降低传统模型常见的"物理幻觉"问题。实验显示,搭载该模型的机器人在执行多任务时,可精准记忆中断前的任务状态,并在任务切换后无缝恢复操作。
基于Qwen3-VL框架优化的RynnScale训练架构,使模型在同等计算资源下实现两倍训练加速,依托超过2000万组训练数据构建起多维能力体系。评测数据显示,该模型在环境感知、视觉问答、轨迹预测等核心场景中表现卓越,其认知、定位、规划等综合能力较前代模型提升显著。特别在具身规划任务中,基于RynnBrain微调的专用模型仅需数百条训练数据即可超越Gemini 3 Pro,展现出强大的场景适应能力。
此次开源计划包含全尺寸基础模型与垂直领域专用模型,其中30B MoE架构模型通过动态参数激活技术,仅需3B活跃参数即可达到72B规模模型的性能水平,显著提升机器人响应速度与动作流畅度。配套发布的RynnBrain-Bench评测基准,首次构建了针对时空细粒度任务的评估体系,填补了行业在具身智能量化评估领域的空白。
据达摩院具身智能实验室负责人赵德丽介绍,RynnBrain通过构建大脑对物理世界的深度理解框架,为通用具身智能的分层架构发展奠定关键基础。该模型已形成可扩展的技术体系,支持快速衍生导航、操作等垂直领域模型。目前团队正推进具身智能系统的全栈开发,此前已开源世界模型融合方案WorldVLA、场景理解模型RynnEC及机器人通信协议RynnRCP等核心技术组件。