巨人天成
产经 科技 企业 数据 峰会 快讯 商业

面壁智能李大海:全模态引领人机交互变革,具身智能或两三年迎跃迁

2026-02-05来源:快讯编辑:瑞雪

随着人工智能技术逐步突破数字边界,向物理世界深度渗透,人机交互正迎来一场范式革命。传统以“一问一答”为核心的交互模式,在机器人、可穿戴设备等场景中逐渐暴露出响应滞后、感知割裂等问题,成为制约AI具身化发展的关键障碍。面壁智能联合创始人兼CEO李大海在接受媒体采访时指出,新一代交互形态已现端倪,但其全面落地需依赖云端与端侧模型能力的协同进化。

清华大学计算机系教授、面壁智能首席科学家刘知远从认知科学角度剖析了交互瓶颈的根源:人类通过听觉、视觉、触觉等多通道并行感知世界,而现有AI模型在多模态协同处理上仍存在显著缺陷。例如,当用户与智能设备对话时,设备往往无法同时处理视觉信息,导致交互自然度大幅下降。这种“单线程”处理模式限制了AI在复杂物理场景中的应用潜力,而全模态模型通过统一架构整合多感官数据,被视为破解这一难题的核心路径。

在产业实践层面,端侧模型与硬件的融合正面临技术权衡。李大海以智能手机场景为例说明,尽管当前头部模型已能支持智能体完成部分复杂任务,但纯云端方案存在隐私风险,端侧部署则受限于算力与功耗。他透露,豆包手机虽实现了智能体模拟人类操作的功能突破,但真正迈向“自然交互”仍需解决输入方式的变革——未来手机若能直接感知环境声音与图像,将大幅提升上下文同步能力,但这同时对硬件能效比提出更高要求。

相较于消费电子,汽车与机器人领域因资源条件更宽松,被视为全模态模型的优先落地场景。李大海特别强调,具身智能的当前瓶颈不在于机械本体,而在于“大脑”的认知能力。一旦模型在环境理解、任务规划等方面取得突破,具身智能可能迎来指数级增长,类似ChatGPT引发的技术跃迁。刘知远则预测,未来两三年内,模型的专业能力与交互效率将同步提升,为多智能体协作奠定基础。

面对技术迭代压力,面壁智能选择以模型能力密度为核心战略。公司提出的“密度法则”指出,大模型的能力保鲜期仅约100天,行业需持续压缩模型尺寸、提升单位算力效率。李大海将这一过程类比芯片行业的制程竞赛,强调通过极致优化降低模型成本,推动其在边缘设备上的普及。他同时指出,端侧模型的商业化需构建开发者生态,单纯依赖模型销售难以实现百亿级设备部署目标。

在竞争格局方面,李大海认为AI产业仍存在结构性机会。尽管科技巨头加速布局,但创业公司可通过聚焦特定场景或技术细分领域建立优势。“选择广阔赛道中的细分市场,或在小市场中做到头部,都有巨大发展空间。”刘知远则从技术演进角度预测,未来五年将见证智能体自主学习能力的爆发,而十年后,多智能体协同将催生群体智能的新形态。

2026AI能力认证新趋势:解锁多模态大模型开发实战技巧与备考攻略
单一的文本或图像处理能力已不再是考核的重点,取而代之的是对多模态大模型(Large Vision Models, LVM)的理解、应用与开发能力。在实战中,你需要具备敏锐的“参数定位”能力——即判断对于特定的…

2026-02-04