巨人天成
产经 科技 企业 数据 峰会 快讯 商业

百度智能云自研万卡集群,能否再次引领AI大模型降价潮?

2025-02-06来源:节点财经编辑:瑞雪

近期,DeepSeek的火爆表现无疑为资本市场注入了一剂强心针,激发了投资者对AI+产业链的热情。在2月5日开工首日,DeepSeek概念指数飙升14.73%,AI应用端和科技板块全线上涨,而2月6日早盘,A股TMT科技板块继续保持强劲势头,DeepSeek与AI算力概念尤为活跃。

就在这一片欣欣向荣之际,中国大模型市场又传来重大消息:百度智能云成功激活昆仑芯三代万卡集群,成为国内首个正式投入使用的自研万卡集群。上线首日,已有超过1.5万家客户通过千帆平台调用该模型。这一里程碑式的事件不仅标志着百度在自研芯片与大规模AI算力布局上取得了新的突破,更预示着AI模型训练成本的大幅下降,为整个行业的发展注入了新的活力。

随着各大科技巨头纷纷加速推进AI算力基础设施建设,万卡集群成为了业界关注的焦点。那么,万卡集群究竟是什么?为何各大企业都在积极自建自研万卡集群?国产万卡集群的不断演进又将如何改变智算产业的面貌?

近年来,AI大模型如雨后春笋般涌现,模型规模和数据参数呈指数级增长。例如,从2018年GPT-1的1.17亿参数量,到2020年GPT-3的1750亿参数量,再到2023年GPT-4的约1.8万亿参数量,参数的快速增长极大地提升了AI模型的性能。然而,这也导致AI模型训练的算力需求每3.5个月翻一番,每年所需算力增幅高达10倍,远远超出了摩尔定律的增速。

以GPT-4为例,其训练过程使用了约25000个英伟达的A100 GPU,持续时间长达90至100天,算力消耗巨大。随着大模型越来越多地应用于企业实际业务场景,后期推理的算力需求也随之增加。因此,大规模GPU算力集群成为必然选择,国内外科技厂商纷纷布局AI算力基础设施,致力于搭建万卡甚至10万卡集群。

“万卡集群”即由超过一万张加速卡(如GPU、TPU等)组成的高性能计算系统,用于加速AI模型的训练和推理过程。与训练周期长、成本高的传统千亿参数模型相比,万卡集群在计算能力、数据处理速度和存储容量等方面实现了质的飞跃。通过并行计算和分布式处理,万卡集群能够显著缩短模型训练周期,提高研发效率。

作为一种灵活的计算基础设施,万卡集群能够根据应用需求进行定制化配置和优化,支持更大规模模型和更复杂的多模态任务,为AI技术的创新和发展提供了更广阔的空间。同时,万卡集群通过提升算力利用率和简化用户部署流程,降低了AI技术的使用门槛,推动了其在各领域的广泛应用。

然而,万卡集群的搭建并非易事。要想建设万卡集群规模的算力中心,需面临算力使用效率、海量数据处理、多芯混训难题、智算中心设计以及稳定性与运维等多重挑战。这些挑战需要运用系统工程方法、精细化设计网络和软硬件整合优化等技术手段来解决。

百度智能云此次成功点亮万卡集群,得益于其在硬件和软件方面的技术创新。硬件层面,自研昆仑芯三代在算力、能效、稳定性等方面全面升级,突破了卡间互联拓扑限制,并采用创新性散热方案,确保集群高效稳定运行。软件层面,百舸AI异构计算平台4.0在构建高性能网络、优化分布式训练、多芯混训和故障诊断等方面发挥了关键作用。

百度智能云依托百舸AI异构计算平台4.0,实现了从集群创建到开发实验、模型训练、推理的全链路优化,不仅提升了自身的智算实力,也为智算行业提供了新的发展思路。凭借自研昆仑芯的技术优势和百舸平台的有力加持,百度智能云已为众多企业提供了高效、稳定、混合多芯的AI基础设施。

例如,生数科技依托百度百舸的能力,在短时间内完成了Vidu大模型的上线和开放API,素材渲染加速效率提升3倍,数据拉取效率提升51倍。长安汽车通过与百度智能云的深度合作,自动驾驶模型训练的算力总体平均使用率提升到90%以上,综合资源利用率提升了50%。教育场景先行者好未来教育集团则借助百舸平台自研出“九章大模型(MathGPT)”,已广泛应用于智能硬件、学而思旗舰学习机等多个业务场景中。

百度智能云自研万卡集群的成功点亮,不仅在国内引发广泛关注,也在国际市场掀起热议。花旗银行在研报中指出,百度、DeepSeek等中国模型的高效和低成本优势,将有助于加速全球AI应用开发,推动2025年人工智能应用的拐点。百度在港股、美股的双双上涨,也印证了这一点。

对于科技公司来说,拥有强大的万卡集群意味着在AI时代奠定了坚实的基础和竞争力。万卡集群的建设不仅反映了企业在技术水平、资金投入和战略规划上的决策和能力,还能提升其在行业中的声誉和影响力,吸引更多的人才、合作伙伴和资金,形成良好的产业生态,为企业的持续发展提供坚实支持。

WebRTC技术赋能物联网卡:解锁工业医疗驾驶毫秒级低时延通信新路径
WebRTC(网页实时通信)技术与物联网卡的深度融合,正通过 “协议优化 + 硬件适配 + 网络升级”,破解毫秒级响应难题。本文基于行业实践,解析 WebRTC 技术原理、物联网卡协同路径及场景落地效果,为…

2025-11-13

智慧公安大数据云平台:以科技赋能警务,构建城市安全治理新生态
通过公安云平台,各类警务数据得以高效整合与流转,实现了从“人海战术”向“数据驱动”的转变。一键式可视化报警设备的引入,进一步拓宽了公众参与治安治理的渠道,实现接警员与报警人视频对讲、现场信息实时推送,为快速处…

2025-11-13

昕锐CL系列激光测距模块:定制化驱动低空经济场景变革新引擎
结语:定制化,是技术普惠的终极路径当测距模块从“标准化商品”进化为“场景化服务”,昕锐CL系列不仅解决了无人机与吊舱的“精准降本”难题,更重新定义了技术与需求的关系:技术突破的价值,不在于参数的堆砌,而在于…

2025-11-13

企业展厅多媒体设备保养指南:从日护到年检的分层维护策略
企业展厅多媒体设备保养频率需按“基础养护+定期检查+深度维护”分层设定,核心频率为每日、每周、每月、每季度,部分设备需年度专业维保。检查设备开机状态,测试核心功能(显示、音响、互动响应)是否正常。 请专业人…

2025-11-13

2025网购流量卡选购指南:不同场景实测教你选到网速稳的好卡
所以,简单概括一下:一张正规的网购流量卡,其网速表现与同运营商的线下套餐并无本质差异。 在流量卡领域,我认为“便宜”不一定直接等于“网速差”。•警惕“物联卡”冒充手机流量卡

2025-11-13

苹果设备与电信流量卡全攻略:从兼容到技巧,助你畅享无忧网络
•运营商网络覆盖差异•手机版本支持频段不同•套餐类型与设备性能不匹配最新的iPhone 14系列甚至已经支持电信的5GSA组网,网速体验绝对令人惊艳!

2025-11-12

2025金砖大赛大数据分析赛项落幕 多元力量共促数智化人才培养新篇章
新道科技助理总裁唐梦彬在致辞中表示,大赛把企业数智化转型过程中的业务模式、典型场景与大数据分析技术相结合,体现行业和企业对人员技能的最新标准,让师生深入了解当前数智化企业的运营和管理模式,提升大数据分析的理…

2025-11-12

量子安全网络新突破:CV-QKD可插拔模块开启高效规模化部署新篇
CUbIQ Technologies:开发了 CV-QKD 收发模块和量子安全架构HPE Juniper网络:将模块集成到其路由平台中,实现量子安全 MACsec 加密Coherent 高意:提供 400…

2025-11-12