巨人天成
产经 科技 企业 数据 峰会 快讯 商业

从语言到世界:商汤林达华谈AI技术范式变革与空间智能新突破

2025-12-18来源:快讯编辑:瑞雪

在空间智能领域,一场悄然发生的变革正引发全球关注。商汤科技最新开源的SenseNova-SI模型,以超越李飞飞团队Cambrian-S的成绩,成为首个在多项基准测试中登顶的国产开源AI。这一突破不仅标志着中国科技公司在前沿技术领域的崛起,更预示着AI发展范式正在经历深刻转型。

商汤科技联合创始人、首席科学家林达华在深度访谈中指出,当前AI行业正站在十字路口。过去三年,以Scaling Law为核心的"大力出奇迹"模式主导了技术演进,但2024年下半年以来,这种路径的边际效应显著递减。他直言:"模型分数仍在攀升,但对物理世界的理解能力却停滞不前,这种增长已触及天花板。"

这种判断与OpenAI前首席科学家Ilya Sutskever提出的"Back to Research"理念不谋而合。林达华团队选择了一条更具挑战的道路:放弃参数竞赛,转而攻克原生多模态与空间智能的底层技术。他们研发的NEO架构,从Transformer Block层面实现视觉与语言信号的深度融合,通过混合注意力机制让模型在推理时同步处理图文信息,彻底颠覆了传统拼接式架构的降维处理模式。

技术突破带来的效果立竿见影。SenseNova-SI在空间推理、三维建模等核心指标上全面领先,数据效率较同类模型提升10倍。更引人注目的是其训练方式创新——通过跨视角预测任务,让模型自主构建三维空间认知,这种"教AI搭积木"的训练方法,使其能准确识别手指数量、预测物体多视角形态,解决了长期困扰行业的"视觉幻觉"问题。

技术突破的价值最终要体现在应用层面。林达华强调"工业红线"概念:任何技术若使用成本高于创造价值,就难以实现规模化落地。为此,商汤在实时语音驱动数字人产品SekoTalk中,通过算法蒸馏技术将扩散模型推理步数从100步压缩至4步,实现64倍速度提升。这意味着消费级显卡即可实时生成高质量数字人视频,为直播、短视频等场景开辟了商业化新路径。

这场变革正在重塑AI技术生态。商汤的双轮驱动战略——底层创新与落地优化并重——已显现成效。NEO架构与SenseNova-SI的开源,为全球研究者提供了全新范式;而SekoTalk等产品的极致优化,则证明了技术突破能快速转化为生产力。林达华特别指出,中国完整的工业体系和丰富应用场景,为空间智能等前沿领域提供了得天独厚的发展土壤。

对于年轻研究者,林达华给出建议:跳出拥挤的大语言模型赛道,关注具身智能、AI for Science等新兴领域。他强调:"智能不只有语言维度,AI的终极目标是构建能理解物理世界的模型。"在这场从"读万卷书"到"行万里路"的技术迁徙中,中国科技公司已占据先机,而真正的突破,将属于那些敢于探索未知领域的创新者。

小程序平台生产厂家怎么选?四大优质平台深度测评与实用指南
它不仅是获得认证的AAA诚信靠谱企业,还拥有齐全的软件著作权,从法律和技术层面保障了用户的数据安全与权益。许多客户,如一家本土烘焙品牌“甜觅坊”,在使用了呱呱赞的小程序后,线上订单月均增长了300%,其负责人…

2025-12-18

自主可信计算:以主动防御之力,为数字时代安全保驾护航
自主可信计算的技术创新集中体现为三大特征:一是软硬结合的双重体系结构,突破传统外挂式防护的局限,将可信模块深度融入硬件架构与软件系统,形成“宿主运算 + 可信监控” 的双节点并行模式,避免单一节点故障导致…

2025-12-17

谷歌安卓新功能:Wi-Fi隐私精细管控,多用户共享密码难题迎刃而解
IT之家 12 月 17 日消息,科技媒体 Android Authority 今天(12 月 17 日)发布博文,报道称谷歌为解决多用户设备(如家庭平板或企业设备)强制共享网络密码的问题,正为安卓系统开发精…

2025-12-17

IPv6底层技术革新:从地址到协议,全方位赋能下一代互联网
双栈技术:设备同时支持IPv4和IPv6协议,可根据目标地址自动选择协议栈通信,适用于过渡期的混合网络环境; 地址转换技术(NAT64):实现IPv6设备与IPv4设备的通信,通过NAT64网关将IPv6地…

2025-12-17