巨人天成
产经 科技 企业 数据 峰会 快讯 商业

Physical Intelligence新突破:机器人15分钟掌握精细操作,进厂打工指日可待

2026-03-21来源:快讯编辑:瑞雪

在机器人技术领域,精细操作能力一直是制约其广泛应用的关键瓶颈。传统方法需要耗费大量计算资源对机器人主模型进行全面训练,不仅耗时漫长,且难以应对工厂环境中对精准度、灵活性和速度的严苛要求。如今,具身智能领域传来突破性进展:Physical Intelligence团队开发的RL token技术,使机器人仅需十几分钟至数小时的真实世界操作经验,即可掌握插网线、拧微型螺丝等高精度任务。

该技术的核心创新在于突破传统训练范式。研究团队没有选择对机器人主模型进行整体微调,而是为其添加了一个专门处理精细动作的"外挂模块"——RL token。这一设计使机器人进化速度提升三倍,在特定任务中的操作速度甚至超越人类远程操控水平。以拧螺丝任务为例,机器人需在10厘米长的螺丝刀上实现亚毫米级定位精度,传统方法因手腕微小偏差导致刀尖误差放大的难题被成功攻克。

技术实现路径包含两大关键突破:首先是VLA模型改造,通过编码器-解码器结构生成包含关键信息的RL token,将复杂观察数据压缩为极简摘要;其次是轻量化强化学习系统,由Actor网络输出动作、Critic网络评估效果,采用节省数据的off-policy训练方法。这两个神经网络可直接部署在机器人本体,实现每秒数百次的实时更新,确保每次试错后立即优化行为策略。

研究团队设计了四项极具挑战性的测试任务:用电动螺丝刀安装M3微型螺丝、系紧扎带、插入网线及电源线。这些任务的成功关键在于最后数毫米的接触精度,传统基础模型虽能完成前期动作,但在关键阶段常因角度偏差或时机失误导致失败。RL token技术通过针对性强化学习,仅用15分钟真实数据即可优化这些"硬骨头"环节。在插网线任务中,机器人经过2小时训练(含15分钟操作数据)后,不仅成功率显著提升,半数操作速度更超越人类示范。

该技术的突破性在于建立了一套通用训练框架:通过预测动作块保持与VLA模型的动作一致性,采用"修改而非推翻"的策略优化现有动作,引入参考动作dropout机制防止模型惰性,并支持人类干预反馈。这些设计使在线强化学习成为可复用的解决方案,无需针对不同任务重新设计,即可直接应用于各类精密操作场景。

智己携手千问大模型,AI超级智能体全域融合重塑出行新未来
从发展趋势来看,未来中国新能源汽车产业将呈现五大发展趋势:一是补能便捷化,补能效率将成为品牌竞争的核心焦点,闪充、换电等新型补能模式将快速普及,逐步替代传统慢充模式,彻底解决消费者的补能焦虑;二是产品高端化,…

2026-03-21

特斯拉拟采购约29亿美元中国光伏设备 助力本土与太空能源布局
快科技3月21日消息,环球时报援引路透社报道,特斯拉计划向多家中国光伏设备企业采购总价值约29亿美元的生产设备,用于太阳能电池板与电池制造。据悉,特斯拉这笔巨额采购订单分为两大板块,即SpaceX 的“太空…

2026-03-21

阿里云全资子公司申请注册“HICLAW”商标 关联开源多智能体协作系统
松果财经讯,天眼查知识产权信息显示,近日,杭州阿里云飞天信息技术有限公司申请注册两枚“HICLAW”商标,国际分类为网站服务、科学仪器,当前商标状态为等待实质审查。 杭州阿里云飞天信息技术有限公司成立于201…

2026-03-21

Cloudflare CEO预测:2027年AI机器人或成互联网流量“主力军”
他以选购相机为例,普通人该行为通常仅会访问5个相关网站,而AI智能体或机器人为获取全面信息,可能会访问多达5000个网站,这些访问行为所产生的都是真实的网络流量和负载,成为互联网发展中必须考量和应对的重要因素…

2026-03-21