大晓机器人近日正式对外发布开源具身原生世界模型Kairos 3.0-4B,这款专为具身智能场景设计的模型采用“多模态理解—生成—预测”一体化架构,能够在端侧直接驱动机器人本体完成复杂任务。该模型通过轻量化设计实现了性能与效率的平衡,为具身智能从实验室走向实际应用提供了关键技术支撑。
在端侧部署能力方面,Kairos 3.0-4B在英伟达Jetson Thor T5000平台上展现出接近实时的生成速度,支持最长7分钟的连贯动态视频生成。这种特性使其既能用于机器人任务规划的仿真训练,也能直接作为决策系统驱动实体机器人执行操作。测试数据显示,该模型在A800 GPU环境下的推理速度较前代Cosmos 2.5提升达72倍,同时将显存占用控制在23.5GB,低于多数同类模型。
硬件兼容性是该模型的另一亮点。开发团队通过模块化设计使其能够适配单臂、双臂及灵巧手等不同形态的机器人本体,并支持跨平台部署。这种泛化能力显著降低了具身智能技术的落地门槛,为工业制造、物流仓储等领域的机器人应用提供了灵活的技术解决方案。
在专业评测中,Kairos 3.0-4B在PAI-Bench-robot和WorldModelBench-robot TI2V等权威基准测试中均取得优异成绩。其双模式运行特性尤为突出——既可生成高质量的仿真训练数据,也能直接输出控制指令驱动真实机器人。这种虚实结合的能力,有效解决了具身智能领域长期存在的仿真到现实转化难题。
