巨人天成
产经 科技 企业 数据 峰会 快讯 商业

宇树发布开源UnifoLM-VLA-0大模型 推动通用人形机器人操作能力升级

2026-01-30来源:快讯编辑:瑞雪

近日,宇树科技宣布开源其最新研发的通用人形机器人操作大模型UnifoLM-VLA-0,标志着视觉-语言-动作(VLA)领域的技术突破。该模型基于Qwen2.5-VL-7B开源框架构建,通过整合机器人操作数据与通用场景的多任务数据集,实现了从传统图文理解向具备物理常识的"具身智能"的跨越式发展。

针对机器人操作任务中指令理解与空间感知的核心需求,研发团队创新性地构建了包含2D检测分割、3D目标定位、空间推理及轨迹预测的多维数据集。通过约340小时的真机操作数据预训练,模型实现了文本指令与空间信息的深度融合,在单一策略网络下即可完成12类复杂操作任务。实验数据显示,该模型在真机环境中展现出卓越的抗干扰能力,即使面对外部扰动仍能保持稳定执行。

技术实现层面,模型采用动作分块预测与双向动力学约束机制,构建了全链路动力学预测模型。这种设计使系统能够统一建模动作序列,深入理解机器人与物体的物理交互规律,从而支持长时序动作规划。在LIBERO仿真基准测试中,多任务模型性能接近理论最优值,验证了其单模型处理多任务的能力。

评估结果显示,UnifoLM-VLA-0在空间感知与理解能力上较基础模型提升显著,在"no thinking"模式下可与Gemini-Robotics-ER 1.5等国际先进模型媲美。基于该模型的动作预测头(ActionHead)集成方案,为机器人提供了更精准的决策支持,在仿真与真实环境中均验证了其通用性优势。

目前,宇树科技已开放模型代码与数据集下载,项目主页提供详细技术文档与演示案例。这一开源举措有望推动具身智能领域的技术发展,为通用人形机器人的商业化应用奠定基础。相关资源可通过GitHub平台获取,开发者可基于现有框架进行二次开发与创新应用。

OpenAI推理大牛Jerry创业新征程:打造持续学习AI,目标筹集70亿资金
2019年加入OpenAI后,Jerry把这一路积累的方法论完整带进了大模型研究中,不仅主导了首个推理模型o1的研发,也深度参与了o3、GPT-4、ChatGPT、Codex等多条核心模型线的构建。 …

2026-01-30

王兴兴谈AI与机器人:用大模型造顶尖机器人 宇树科技将推新品
访谈中,王兴兴表示:在当前阶段,谁能最先用大模型技术成功制造出机器人,谁就是世界上最顶尖的AI公司。在王兴兴看来,这是最有意义的一件事情。 值得一提的是,近日,宇树科技还将与宸境科技达成联名合作,共同发布两…

2026-01-30

字节跳动2026年定调“勇攀高峰”:聚焦AI模型,提升人才密度共赴新程
此外,他还表示,在攀高峰的过程中,公司每个业务都有需要重点突破的地方,而重中之重,是 AI 模型能力要做到行业前列,并通过助手整合好已有业务,整体攀上新的高度。IT之家注意到,梁汝波还提到,要实现勇攀高峰就…

2026-01-30

手机飞行模式不只是飞行专用!解锁隐藏功能,让你的手机使用体验大升级
打开飞行模式,就能完全断绝所有外部干扰,使你的手机进入真正的休眠状态,这对你的睡眠质量和手机的续航都有好处。他不仅在电池电量不足时使用它,还在需要快速修复信号、以及晚上睡觉时使用它。一旦你了解了它的真正价值,…

2026-01-30

2025全球智能手机销量榜揭晓:苹果强势领跑,iPhone 16系列成最大赢家
报告显示,高端智能手机市场的单品集中度进一步提升,苹果公司凭借 iPhone 16 系列及部分前代机型,在销量前十名中占据了七个席位。这一数据分布反映出,尽管安卓阵营在机型数量上占据绝对优势,但在全球单品销量…

2026-01-29