巨人天成
产经 科技 企业 数据 峰会 快讯 商业

昇腾大EP方案发力六大行业,打通AI大模型商业落地“最后一公里”

2025-09-30来源:快讯编辑:瑞雪

AI智能体正以惊人的速度从实验室走向产业一线,2025年成为业界公认的“AI智能体元年”。随着AI应用在千行百业中爆发式增长,算力需求的底层逻辑发生深刻转变——过去以模型训练为核心的“厚积”阶段逐渐退场,AI推理的“薄发”正成为驱动算力增长的核心动力。企业关注的焦点已从“AI能做什么”转向“AI能做好什么、能低成本做好什么”,如何在推理环节实现降本、提质、增效的三重突破,成为行业共同面临的课题。

在华为全联接大会2025期间的昇腾AI产业峰会上,一则重磅消息引发行业关注:昇腾联合数十家行业伙伴,首次集中展示了大规模专家并行(大EP)架构的六大行业实践成果。从运营商的AItoC业务拓展到政务便民服务,从教育个性化学习推荐到金融风险实时预警,这一技术方案已深度渗透50余家客户的核心场景,用实打实的应用效果证明了推理系统突破带来的价值。

这场集体发布的意义远超技术展示本身。当全球AI大模型产业化进入深水区,推理环节作为技术价值转化的核心,直接决定着AI红利能否真正落地。尤其是在DeepSeek推动混合专家模型(MoE)成为主流后,传统部署模式与新技术路线的适配矛盾日益凸显。单机部署时专家权重的高占用率导致内存不堪重负,PD混合部署易引发资源分配失衡,而MoE模型的动态路由机制更常造成“专家热点不均”——部分专家超负荷运转,其余专家却闲置,形成算力资源的结构性浪费。

这些架构层面的问题最终转化为企业的实操痛点:硬件堆叠难以应对长文本处理、多轮对话等复杂推理需求,首Token时延居高不下影响用户体验,单位Token成本高企削弱商业竞争力。面对MoE模型带来的推理瓶颈,昇腾在业界率先提出以大EP架构创新为核心,结合超节点硬件及基础加速软件的“一体化破局”方案,为适配MoE推理提供了“最优解”。

大EP架构的核心逻辑是将MoE模型的多个路由专家分散部署于多卡环境,通过动态调度实现算力资源的精准匹配。这一设计既保留了MoE模型“专业分工”的优势,又解决了“协同混乱”的问题,让每卡算力得到充分利用。而其高效运转离不开多机多卡超节点的支撑——以昇腾384超节点为例,依托华为自研的灵衢互联协议,通信带宽提升15倍,单跳通信时延降至200纳秒以内,为专家协同搭建起“通信高速公路”。在实际部署中,该方案可实现DeepSeek模型“1卡1专家”的配置,容纳256个路由专家、32个共享专家及96个冗余专家,在保障系统稳定性的同时实现算力资源的高效利用。

从此次发布的运营商、政务、教育、金融、大模型、电力六大行业实践来看,昇腾大EP方案已从先行先试走向规模落地,成为MoE模型推理部署的“事实标准”。在电信行业,三大运营商基于自研AI平台部署昇腾大EP方案后,吞吐能力提升4倍、时延降低50%,调用成本更是下降超50%,有力支撑了移动AI时代新兴业务的高速发展。教育领域,某顶尖985高校引入该方案后,2k长文本输入输出场景的吞吐性能提升3倍以上,成功满足全校数万师生多样化的AI需求。金融行业,中国邮政储蓄银行通过部署昇腾大EP方案,实现3倍吞吐性能提升,加速了“邮智”大模型的规模化应用,深度赋能智能客服、审贷助手等业务场景。

数据显示,截至目前,昇腾大EP方案已深入六大行业的50余家客户核心场景,以“一份投入,多份产出”的高效模式最大化成本效益。这一成果的背后,是中国AI产业差异化发展路径的生动实践——在单卡算力与全球顶尖水平存在差距、企业AI投资预算相对有限的约束下,中国产业界通过“技术垂直整合+行业场景深耕”的组合策略,走出了一条适配自身需求的AI落地之路。

从技术层面看,当国际巨头聚焦于“提升单卡算力”时,中国企业选择从“系统层面优化资源效率”切入,通过大EP+超节点创新将软硬件协同效能最大化,以“群体优势”弥补“个体差距”。从产业层面看,中国AI产业的核心需求是“千行百业的规模化落地”,而非局限于特定场景的“AGI梦”。昇腾大EP方案通过“低成本高性能”的目标,有力支撑了“人工智能+”的蓬勃发展。这种差异化路径不仅为中国AI产业的规模化发展提供了坚实支撑,也为全球AI产业的多元化发展提供了“中国方案”。

TLKS-PMG-TP装置:全天候精准监测,守护输电线路“体温”安全
TLKS-PMG-TP输电线路线夹及导线温度在线监测装置应运而生,以其高精度测温与全时段监测能力,为输电线路装上了一双“精准温控眼”。 TLKS-PMG-TP装置不仅提供实时监测,更实现了输电线路运维的智能…

2025-11-15

华为在阿根廷完成5G-A双场景验证 下行峰值速率创新高助力无线发展
无线业务的发展对网络性能提出了更高的要求,而阿根廷市场一直走在拉美创新无线技术探索的前列,本次创新测试验证了两种未来5G-A商用载波组合,包括覆盖更强,更易大规模部署的Sub3.5G TDD+FDD 3CC…

2025-11-14

Gartner发布2026十大技术趋势:AI主导变革,从“大而全”迈向“精而实”
近日,商业与技术洞察公司Gartner发布了2026年十大战略技术趋势:AI超级计算平台、多智能体系统、特定领域语言模型、AI安全平台、AI原生开发平台、机密计算、物理AI、前置式主动网络安全、数字溯源,以及…

2025-11-14

中国6G技术首阶段试验圆满收官,通信领域创新再启新程
在全球竞相布局6G的背景下,中国率先完成第一阶段技术试验,展现了其在通信领域的强大实力。此次试验涵盖了6G关键核心技术,测试了多种潜在技术和系统性能。业界普遍认为,6G网络将实现地面与卫星通信的融合,构建空…

2025-11-14

桥梁位移监测仪:精准感知位移 灵活部署续航 守护桥梁安全出行
这种方式能够利用清洁能源为设备持续供电,既体现了节能环保的理念,也巧妙地解决了在市政供电不便场景下的设备续航问题,保障了监测工作的不间断进行。为了便于现场操作与维护,桥梁位移监测仪还配备了便捷的配置方式。 …

2025-11-14

5.5G辐射危害健康?物理学者:比太阳光频率低,基站越密越安全
我当时听了都愣了,太阳光那不是好东西吗,怎么还跟信号辐射扯一块儿了? 最有意思的是,他说大家都觉得基站多了辐射就大,这完全是搞反了。之前吵得最凶的那个阿姨,现在天天用5.5G跟外地的孙子视频,还跟邻居说这新基…

2025-11-14

技嘉B860M冰雕主板深度评测:千元价位与酷睿Ultra的完美搭档
XMP AI Boost的DDR5-8200 CL40挡位也能够顺利开启,再叠加上高带宽、低延迟功能的性能加成之后,内存性能继续得到提升,但写入性能基本上是到顶了,主要是受限于B860芯片组主板无法调整CP…

2025-11-14

上海电信“双万兆”护航进博会:数智赋能通信保障,服务跨越语言距离
浦东机场T1电信营业厅及T2一站式服务中心电信柜台是进博会观众和外宾抵沪的“入境第一站”, 两处服务点均开设“进博专席”,为参展人员和往来旅客提供中英双语咨询、交通指引与爱心便民服务。未来,上海电信将持续夯…

2025-11-13

高光谱探测器助力宽带叠层扫描成像 开启3D高光谱成像新篇
最近的研究表明,能量分辨或高光谱探测器可以在某种程度上取代单色器的作用来执行,例如,在单次采集中使用宽带辐射进行边缘减影叠层扫描成像。利用这样的探测器,时间相干性变得可调(在探测器的能量分辨率的限制内)并且在…

2025-11-12

荣旭传媒技术破局:以专业方案化解直播痛点,成就高性价比之选
传统方案在视频、音频和网络方面存在诸多不足,而荣旭传媒通过先进的技术和专业的设备,有效解决了这些问题。传统方案的视频分辨率较低,画面不够清晰,而荣旭传媒的4K 超高清视频拍摄制作让画面质量有了质的提升;传统…

2025-11-12