巨人天成
产经 科技 企业 数据 峰会 快讯 商业

联合谷歌共建:戴盟发布数百万小时触觉具身数据集

2026-04-21来源:美通社编辑:

中国深圳2026年4月21日 /美通社/ -- 当行业还在讨论模型,真正决定具身智能上限的竞争,已经转向数据基础设施。

近日,戴盟机器人联合Google DeepMind、中国移动、新加坡国立大学、香港科技大学、北京大学、清华大学等多家全球顶尖学术机构与产业伙伴,正式发布全球最大规模含触觉的全模态物理世界数据集Daimon-Infinity。


这并不是一次普通的数据集发布。更准确地说,这是具身智能产业从"能力验证"走向"基础设施建设"的一个标志性节点。

按照规划,Daimon-Infinity将于年内形成数百万小时级数据规模,覆盖家庭、户外、工业、公共服务等多个真实场景,融合触觉、视觉、动作轨迹、执行动作、语音文本等多维信息。其中,10000小时高质量数据已率先开源,上线当日即被阿里魔搭社区置顶热推。

如果说过去行业争论的核心是"什么模型更强、什么本体更优",那么今天一个越来越清晰的共识正在形成:决定具身智能能否真正走出实验室、进入复杂现实世界的,已经不只是模型本身,而是高质量、规模化、可持续生产的物理世界数据。

Daimon-Infinity的意义,不只是"又一个数据集"。它更像是在具身智能时代,提前卡位一张真正稀缺的牌:数据底座、训练燃料和生态接口。

这件事为什么重要?因为它同时踩中了具身智能当前最关键的三个点:物理交互、真实场景、持续生产能力。

一,缺乏物理交互,具身智能走不远

过去很长一段时间,具身智能主要依赖视觉模态。但在真实物理世界里,机器人面对的不是干净、标准、无遮挡的环境,而是充满反光、遮挡、形变、摩擦、滑移、不确定接触的复杂场景。仅靠视觉,机器人可以完成识别和定位,却很难真正完成稳定、精细、可泛化的操作。

而触觉,恰恰补上了这一层最关键的反馈。它让机器人不仅知道"物体在哪里",更知道"是否接触""接触是否稳定""是否正在滑移""材质是软是硬""纹理和形变如何变化"。

这背后不是一次传感器升级,而是一次能力范式的切换:机器人开始从"看见世界",走向"接触世界、理解世界、操作世界"。

这也是 Daimon-Infinity 最核心的价值之一。市场上不少数据集也会标注"含触觉",但深挖之后会发现,很多仍停留在单一力觉或低维触觉层面;而 Daimon-Infinity 引入的是真正意义上的高密度全模态触觉数据,覆盖接触形变、滑移趋势、接触状态、物体纹理、软硬程度、材质特征等十余种关键物理信号,能够更完整地还原真实物理交互过程。


这条路线并不是概念先行,而是建立在戴盟长期积累的技术能力之上。团队孵化于香港科技大学,以视触觉技术为核心壁垒,将复杂触觉信息转化为更适配模型学习的图像化表达,大幅降低具身模型理解物理交互的门槛。

从效果上看,触觉的加入并非边际优化,而是显著提升:经验证,使用Daimon Infinity对具身模型进行预训练时,仅需约十分之一的数据量,即可在精细操作任务中达到更优效果,训练效率提升10倍。这也意味着,真正高价值的数据,不是简单堆量,而是能显著提升模型学习效率的数据。

二、真正稀缺的,不是数据量,而是持续生产真实世界数据的能力

今天很多团队都认同"数据重要",但真正的分水岭并不在认知层,而在供给层。

过去,具身数据采集高度依赖封闭式数采厂。这类模式的问题很明显:成本高、场景窄、重复度高、环境过于标准化。它可以生产"整齐"的数据,却很难生产真正对现实泛化有价值的数据。而具身智能最需要的,不是高度重复的理想样本,而恰恰是那些来自真实环境、真实任务、真实人类操作中的复杂长尾数据。

Daimon-Infinity的另一个关键点,在于戴盟构建了全球最大规模的外发式数据采集网络。通过自研的轻量化、便携式采集设备,数据采集被从封闭场地中释放出来,进入家庭、户外、工厂、教育、公共服务等更广泛、更复杂,也更非标准化的真实场景。


这带来的意义,不只是"多了一些场景",而是直接改变了数据供给机制, 是一种典型的基础设施型能力。因为一次性做出一批数据,并不构成长期优势;真正构成长期优势的,是建立起一个能稳定、持续、低成本地产出高价值数据的系统。数百万小时级的数据规划,其真正的分量也在于此。它代表的不是一次发布的体量,而是一个已经开始成型的数据生产网络。

三、从原始采集到模型可用,中间隔着真正的门槛

具身智能的数据难点,从来不只是"采到",而是"能不能用"。当触觉加入后,数据处理难度会显著上升:如何将触觉与视觉、动作轨迹、语言指令等多模态信息在时间轴与空间轴上精准对齐,如何把真实世界中的接触状态、滑移变化、操作过程转化为模型真正可学习的训练样本,这需要一整套复杂的数据处理管线。

拥有海量原始数据,并不等于拥有高质量训练数据。真正的差异,体现在后端的数据处理、融合、标注、重建与结构化能力上。这也是戴盟与阿里云联手的关键意义——双方共同打造"顶级数据 × 顶级算力"的全链路数据处理引擎,将大规模原始数据转化为可供具身模型高效吸收的有效数据,实现多模态的高精度融合,把真实物理交互过程嵌入到每一帧数据之中。


从产业角度看,这意味Daimon-Infinity的竞争力并不只是前端采集能力,而是已经开始形成"采集—处理—训练—开源—生态反馈"的完整闭环。一旦闭环形成,数据将不再是静态资源,而是会不断复利的动态资产。

四、开源的意义,不只是共享资源,而是加速形成行业标准

此次数据集由戴盟主导,联合多家全球顶尖高校、科研机构与产业伙伴共同参与,本质上已经超越了一家公司单点产品发布的范畴。这更是集产业与学术之力,共同推动一套新的数据标准和协作范式。

由此可见,在任何一个新产业周期里,真正能放大价值的,从来都不只是单点产品能力,而是能否占据底层基础设施、关键标准和生态组织位置。

从这个维度看,Daimon-Infinity 的想象空间,显然已经超出了"数据集"本身。它不是一个孤立的数据产品,而是戴盟在具身智能时代提前铺设的一条核心主干道——连接真实世界、模型训练、场景泛化与产业落地的那条路。从具身产业发展的视角来看,Daimon-Infinity的价值就不再只是"数据很多",而是它开始成为机构共同依赖、推动行业往前走时绕不开的基础能力。

 
上海畅途租赁双市场资产证券化持续发力 汽车融资租赁规模稳步扩容
近日,上海畅途融资租赁有限公司(以下简称“畅途租赁”)成功发行2026年度第二期定向资产支持票据(ABN),发行规模达8.46亿元。至此,2026年以来畅途租赁已先后完成六笔标准化融资产品发行,涵盖ABS、SCP、ABN、PPN、M

2026-04-21