巨人天成
产经 科技 企业 数据 峰会 快讯 商业

华为云Agentic Infra技术革新:引领AI算力底座迈向全新进化时代

2026-06-06来源:快讯编辑:瑞雪

在上海举办的2026华为云INSPIRE创想者大会Agentic Infra云基础设施技术论坛上,一场关于AI基础设施未来发展的深度对话拉开帷幕。本次论坛以"进化,从AI Infra到Agentic Infra"为核心命题,吸引了来自全球的顶尖技术专家、行业领袖与生态合作伙伴,共同探索智能体时代下云基础设施的技术革新路径。

华为云基础设施云服务产品线总裁鲍亮在开幕致辞中指出:"云计算已进入Token工业时代,计算范式正经历根本性变革。"他强调,传统基础设施难以支撑智能体时代对算力效率、记忆容量与自治能力的严苛要求。为此,华为云提出"Agentic Infra"新范式,通过构建"高效Token工厂+通智一体化调度+持续学习+安全自治"四大核心能力,重新定义AI算力底座。其中,灵衢智算集群AICS实现算力效率质的飞跃,存算一体架构突破记忆瓶颈,AgentSphere运行时环境确保安全部署,Volcano调度系统达成资源最优配置。

华为公司Fellow、云系统首席专家余洲系统阐释了"Agentic计算机"概念。他表示,这种新型基础设施将服务对象从人类转向AI,围绕万亿级Token处理进行全栈优化。通过软硬芯深度协同,华为云实现四大技术突破:灵衢网络将分散的CPU、NPU、SSD和内存构建成统一计算资源池;基于昇腾950的1024卡集群使算力提升2.6倍;记忆存储解决方案AMS提供PB级记忆空间,缓存命中率达95%;高性能极简网络支持算力与IO资源的动态配比。这些创新使推理效率、序列长度与速度指标均获得显著提升。

面对大模型训练中的资源利用率困境,华为公司Fellow、华为云服务首席架构师顾炯炯推出FlexNPU柔性液态算力架构。该架构在训练框架与硬件层间引入软件定义层,实现算子级时空复用与硬件故障隔离。测试数据显示,其将节点弹性恢复时间从分钟级压缩至秒级,单位Token算力成本降低63%,真正做到"算力零闲置,Token不浪费"。这种创新架构特别适用于多模型共卡、推理训练混合等复杂场景,为AI工程化落地提供关键支撑。

云原生计算基金会(CNCF)中国区总监陈泽辉分享了行业观察:Kubernetes作为AI操作系统,已在82%的企业生产环境中部署,Agentic AI部署比例更高达74%。CNCF TOC副主席王泽锋进一步揭示调度系统的演进方向,Volcano通过多调度器免锁并行架构,将Agentic工作负载调度耗时降低99%。在运行时层面,AgentCube与Kuasar的组合实现50毫秒级冷启动,Kthena路由感知算法将在630版本正式商用,这些突破标志着调度系统从工具属性升维为资源本体。

理论创新与实战验证形成闭环。AReal完成全栈算子适配,小红书Relax框架实现固量弹性动态平衡,面壁智能三值量化技术在昇腾卡上验证成功,芒果TV灵创平台完成视频模型昇腾适配。这些案例证明,华为云提供的不仅是技术组件,更是完整的工程化解决方案。当传统"堆卡"模式遭遇瓶颈,以Token为处理粒度、通智深度融合的"超级计算机"正在重塑行业格局。

云深处DR02人形机器人升级亮相,复杂环境作业稳,助力电力运维精细化
【太平洋科技】近日,云深处科技宣布对DR02人形机器人完成产品升级,机型突破以往性能演示阶段,落地变电站实操场景,形成从环境移动到现场作业的商用落地能力。 整机拥有IP66防尘防水规格,可在粉尘、淋雨、高…

2026-06-06

苹果战略大转向:砍掉Vision Pro,押注AI眼镜开启消费电子新篇章
其一,赛道落地确定性极强,不存在场景与成本悖论,具备全民普及基础,市场空间远超高端XR头显;其二,AI眼镜是生成式AI时代的最佳硬件入口,作为贴近人眼的无感交互终端,能承接各类AI智能服务,有望替代手机成为下…

2026-06-06

人形机器人开启预售:从工厂走向家庭,未来“赛博伙伴”时代来临?
据封面新闻此前报道,2025年12月31日,四川具身人形机器人科技有限公司正式发布了全球首款主打情感交互的人形机器人“爱湫-AIQ”。具身科技CEO兼CTO冯振宇告诉记者,该人形机器人技术核心在于提升交互理…

2026-06-06