巨人网
产经 科技 企业 数据 峰会 快讯 商业

自主化智算未竟之路:算力荒缓解后,建设还需加速吗?

2024-12-23来源:蓝鲸新闻编辑:瑞雪

近期,国内算力市场经历了一场从短缺到过剩的快速转变,引发了业界的广泛关注与讨论。2023年,随着大炼模型风潮的兴起,全球算力需求激增,高端显卡一卡难求,各地纷纷加速数据中心与智算中心的建设,旨在缓解国产大模型面临的算力瓶颈。

然而,进入新的一年,算力市场风向突变,高端显卡的囤积不再是一门赚钱的生意,“GPU倒爷”们纷纷发出滞销的哀叹。算力租赁市场同样遭遇寒流,理想的上架率遥不可及,大量资金建设的算力设施闲置,难以找到承租方。

面对这一现状,有声音认为算力荒已经缓解,市场供过于求,应放慢自主化智算的建设步伐。甚至有观点认为,智算中心建设过剩,大模型已无需更多算力支持。然而,这些看法是否站得住脚?

回顾2023年算力荒的焦灼时刻,倪光南院士曾警示,要避免盲目建设低水平智算中心,防止其沦为“技术房地产”和“数字烂尾楼”。如今,算力市场从短缺到过剩的急剧变化,主要源于三个方面:

一是价格高昂导致“用不起”。英伟达高端显卡作为AI训练的首选,一度供不应求,价格飙升。尽管价格有所回落,但中小企业仍难以承受,导致高端算力需求受限。

二是国产算力卡“不好用”。国产算力集群同样面临上架率不高的问题,主要是由于异构算力之间的协同调度复杂,缺乏完善的配套措施,导致客户流失。

三是市场需求变化导致“用不上”。随着“百模大战”的落幕,企业不再盲目大炼模型,预训练算力需求大幅下降,而推理算力市场尚未完全爆发,导致训练算力闲置。

然而,这并不意味着自主化智算的发展可以就此停滞。从长远来看,国内智算基础仍然薄弱,需要继续补课打牢基础。美国等IT先行者早已在IT建设上大力投入,国内智算虽发展迅猛,但仍需加速追赶。

同时,自主化AI算力需求仍未得到充分满足。海外AI算力进口受限,国内AI训练芯片市场高度依赖英伟达,供应链安全面临威胁。因此,加快自主化智算建设,提高国产算力芯片使用占比,是当务之急。

算力需求仍在持续增长。大模型的规模法则仍在继续,视频生成模型等新型应用对算力的需求量巨大,超万卡智算中心成为不可或缺的基础设施。同时,随着基础模型市场集中度提高和能力提升,AI应用需求将进一步释放,推动AI行业渗透率、普及率提升,对推理算力的需求也将迎来爆发。

因此,自主化智算并不存在过剩问题,更不应放慢发展步伐。解决算力市场的问题,关键在于如何合理地推进自主化智算的建设与运营。智算厂商之间的竞争已从售卖硬件资源与智算解决方案转变为多维度、综合性、长期服务的竞争。

为了应对自主化AI算力的痛点问题,智算厂商们正在积极寻求解决方案。一方面,通过提供系统平台来屏蔽底层异构硬件的复杂性,让企业和开发者能够更方便地使用国产算卡。另一方面,通过软硬件系统的无缝配合提高国产AI的性能,解决低质量算力过剩与自主化高质量算力不足的结构性问题。

智算厂商还注重运营问题的解决。一些地方在智算中心建设前即提出上架率、收益率等要求,确保项目投运后的使用率。同时,要求建设方提供设计、使用、运营等一体化服务,避免智算中心成为“数字烂尾楼”。以用促建、以服促用已成为自主化智算发展的必然潮流。

总之,国内智算的发展已取得显著成绩,但人无远虑必有近忧。自主化之路不能就此止步,而应一鼓作气,夯实已有成果,为接下来的智能浪潮做好准备。避免低质量算力过剩与加速自主化智算发展应并行不悖,理性看待。