巨人天成
产经 科技 企业 数据 峰会 快讯 商业

中科曙光发布scaleFabric:国产高端RDMA技术突破,智算集群迎来“算力大动脉”

2026-03-13来源:互联网编辑:瑞雪

在AI算力需求持续攀升的背景下,我国智算基础设施领域迎来关键突破。中科曙光近日宣布,成功研制出国内首款全栈自研的400G无损高速网络系统——scaleFabric,该系统基于原生RDMA架构打造,实现了从底层IP核到上层管理软件的100%自主可控,为超大规模智算集群提供了高性能网络解决方案。

当前,万卡级智算集群已成为AI大模型训练的主流形态。研究数据显示,在分布式训练场景中,网络通信耗时占比高达30%-50%,网络性能直接决定算力系统的整体效率。作为提升通信效率的核心技术,RDMA网络凭借零丢包、高带宽、低延迟等特性,被全球顶级超算中心广泛采用。据TOP500榜单统计,全球约60%的高性能计算系统采用InfiniBand网络架构,但该领域的关键技术长期被海外厂商垄断。

中国工程院院士邬贺铨在视频致辞中强调:"高速网络是算力基础设施的'神经中枢',其自主可控性直接关系到国家算力安全与发展质量。面对大模型训练对网络提出的超低延迟、超高带宽、无损传输等严苛要求,发展自主RDMA技术已成为产业界的共识。"

scaleFabric系统的研发突破了多重技术壁垒。该系统构建了完整的自主技术体系,涵盖112G SerDes IP核、交换芯片、网卡、交换机等核心硬件,以及驱动与管理软件。在性能指标上,400系列网卡采用PCIe5.0接口,端口带宽达400Gbps,端到端时延低至0.9微秒;交换机单端口带宽800Gbps,整机交换容量双向64Tbps,交换时延约260纳秒,支持800G×40或400G×80端口扩展,可满足万卡级集群的通信需求。

在稳定性与扩展性方面,该系统采用信用制无损流控机制,从根源上避免拥塞丢包,链路故障恢复时间小于1毫秒。经近万卡集群长达10个月的稳定运行验证,其交换机端口密度较英伟达NDR提升25%,网卡最大QP数支持提升100%,单子网互连规模达传统IB的2.33倍,可支撑最大11.4万卡集群部署,同时网络总成本降低30%。

实际应用层面,scaleFabric已部署于国家超算互联网郑州核心节点,支撑三套总规模达3万卡的scaleX智算集群稳定运行。中科曙光高级副总裁李斌透露,该系统成功支持跨POD组网及大规模并行训练任务,验证了国产原生RDMA技术在高端智算场景的可行性。随着产品在超大规模集群中的落地,围绕scaleFabric的高性能网络产业生态正在加速形成。

此次突破标志着我国在智算互联领域形成自主技术路径。依托在计算、存储、网络领域的长期积累,中科曙光已构建起"算-存-网"协同发展的完整算力底座,为AI基础设施提供系统级支撑。在"人工智能+"战略推动下,算力基础设施正进入升级周期,国产原生RDMA网络的落地补齐了我国智算产业链的关键环节。

萝卜快跑携手速腾聚创,千线级激光雷达助力无人驾驶迈向新高度
在无人驾驶技术飞速发展的今天,百度旗下的无人驾驶出行服务平台萝卜快跑即将迎来一项重大突破:它将首次搭载千线级激光雷达。这一消息无疑为自动驾驶行业注入了新的活力,尤其是在市场对高精度传感器需求日益增长的背景下。…

2026-03-13

百度萝卜快跑迎新突破:速腾聚创助力 或将首次上车千线级激光雷达组合
观点网讯:3月12日,百度旗下无人驾驶出行服务平台萝卜快跑,或将首次实现千线级激光雷达的上车应用,该独家前装定点已由速腾聚创获得。据介绍,速腾聚创将为萝卜快跑新一代前装量产Robotaxi车型提供“千线级EM…

2026-03-13

高压氢能储运时代:氢气压缩机技术突破与未来趋势深度解析
针对燃料电池汽车加氢站的压缩机,需匹配"低速大扭矩"的驱动特性,通过优化电机极对数与压缩机曲轴转速比(如1:4),实现平稳的压力攀升;而大型炼化企业的氢气循环压缩机,则需采用多级压缩+中间冷却设计,通过降低每…

2026-03-13

谷歌Pixel手机将推通勤模式:智能过滤通知 打造个性化公共交通体验
IT之家 3 月 12 日消息,科技媒体 Android Authority 昨日(3 月 11日)发布博文,报道称谷歌为优化用户乘坐公共交通时的设备体验,正计划为 Pixel 手机推出“通勤模式”(Tra…

2026-03-12

中科曙光发布scaleFabric国产原生RDMA高速网络 补齐智算基建关键一环
该产品基于原生RDMA架构,从底层的112G SerDes IP、硬件设备到上层的管理软件实现100%自主研发,填补了国内数据中心高速网络领域的空白,以比肩国际顶尖同类产品的性能表现,为超大规模智算集群铺就了…

2026-03-12