商汤绝影近日正式推出端侧多模态智能体基座大模型Sage,这款采用MoE架构的模型总参数量达32B,但激活参数仅3B,成为全球首款在车端实现复杂智能体能力的基座大模型。通过在英伟达Orin X端侧平台的部署,Sage成功突破了传统端侧模型仅能响应简单指令的局限,将云端级智能体能力首次落地于车载场景。
在智能座舱领域,云端依赖与端侧能力不足的矛盾长期存在。云端模型虽具备复杂任务处理能力,但面临延迟高、Token成本昂贵等问题;端侧模型受限于算力与参数规模,仅能执行基础指令交互。Sage的发布打破了这一技术僵局,其核心优势在于通过3B激活参数实现了超越云端大模型的性能表现。在PinchBench公开评测中,Sage以94%的任务完成率领先Claude-Opus-4.6、GPT-5.4等国际主流模型,同时显存占用仅为42B激活参数的MiMo-v2-Pro的1/31,算力消耗降低至其1/14。
这款模型的技术突破源于两项自研后训练技术:SCOUT分级协同学习框架与ERL可擦除强化学习。SCOUT通过"小模型探路-大模型吸收"的机制,将复杂任务学习成本降低60%,有效解决了车载场景中空间规划、设备联动等任务的训练难题。ERL技术则赋予模型自我纠错能力,可自动识别并擦除推理过程中的错误步骤,使复杂任务成功率提升20%。这两项技术协同作用,推动Sage从语言模型进化为具备独立任务闭环能力的智能体。
在专业能力维度上,Sage展现出全面领先优势。MMLU Pro跨学科测试中取得76分,较同级端侧模型提升10%;GPQA Diamond研究生级推理测试得分77分,提升幅度达33%;座舱语义与视觉理解测试以91分领先,证明其在多模态感知方面的独特优势。特别在τ2-bench工具调用基准上,Sage以80分实现38%的显著提升,展现出强大的任务执行能力。
实际场景应用中,Sage实现了90%以上的场景推理精度,长链路工具调用成功率达92%,环境感知任务成功率94%。在Orin X平台部署下,模型首字响应时间约0.5秒,单Token推理延迟低至0.03秒,生成吞吐达80 tk/S。这些性能指标使其能够实时解析用户复合指令,自动联动空调、导航等车载系统,甚至根据乘员状态与路况主动提供儿童模式、智能路线调整等服务。
作为智能座舱的技术基石,Sage已形成完整的生态支撑能力。该模型可无缝接入OpenClaw、Hermes等主流Agent框架,覆盖出行、家庭等全场景应用。在北京车展期间,商汤绝影将推出搭载Sage的Sage Box硬件方案,为舱驾一体化的量产落地提供核心AI支撑,推动智能座舱从基础交互向高阶舱驾融合服务跨越。
