巨人网
产经 科技 企业 数据 峰会 快讯 商业

AI大模型商业化挑战加剧,六小虎2025年能否跨越生死线?

2025-01-10来源:ITBEAR编辑:瑞雪

随着人工智能领域的飞速发展,AI大模型正经历着前所未有的变革与挑战。近期,曾被誉为“AI大模型六小虎”之一的零一万物,在行业内引发了广泛关注。据报道,这家曾经的独角兽企业已不再执着于训练超级大模型,转而与阿里云携手成立了“产业大模型联合实验室”,其大部分训练和AI基础设施团队已并入该实验室。此举标志着国内首家AI大模型企业公开调整了战略方向。

零一万物的转型,不禁让人思考:这是否会是AI大模型创业公司“中途变道”的序幕?大模型行业的“摩尔定律”——扩展定律(Scaling Laws)是否已触及天花板?在追求通用人工智能(AGI)的技术梦想与实现商业化落地之间,创业公司该如何平衡与抉择?

面对这些灵魂拷问,零一万物CEO李开复在接受采访时直言:“仅仅一年多的时间,传统扩展定律的边际收益已明显递减,商业化同样如此。对于初创公司而言,投入巨额资源训练超大参数规模的模型,性价比极低,显然不是务实之选。”这一观点再次引发了行业对于扩展定律的广泛讨论。

扩展定律最早由OpenAI提出,它指出AI大模型的性能会随着模型参数规模、训练数据量和计算资源的增加而提升。受此理论影响,国内外大模型平台纷纷斥巨资购买GPU,提升计算能力,将模型参数规模推至数千亿甚至上万亿。然而,近年来,扩展定律的有效性开始受到质疑。据外媒报道,OpenAI的下一代模型(代号Orion)在某些任务上的改进微乎其微,与GPT-3到GPT-4的飞跃相比,提升幅度显著缩小。尽管OpenAI CEO否认了这一说法,但GPT-5的迟迟未推出,仍让外界猜测纷纷。

与此同时,Google旗下的Gemini 2.0也未能达到预期目标,Anthropic的Claude 3.5 Opus发布时间一再推迟。然而,并非所有人都认为扩展定律已失效。英伟达CEO黄仁勋在CES 2025上表示,基础模型预训练的扩展定律仍然有效,并出现了后训练扩展定律和测试时间扩展定律。其中,“测试时计算”为提升AI性能开辟了新途径,如OpenAI的o3模型能在推理过程中进行计算,通过“思考更长时间”解锁新能力。

尽管存在不同声音,但行业普遍认为,单纯依靠堆算力、堆参数的粗暴发展模式已成过去。高昂的成本导致边际效益严重递减,投入产出比成为企业不得不考虑的现实问题。近年来,大模型训练成本飙升,从2017年的数百美元到2023年的数千万美元甚至上亿美元,五年间成本增长了数十万倍。国内大厂如字节跳动、百度、阿里、腾讯等,都在筹划搭建万卡甚至十万卡GPU集群,采购成本高昂。

在此背景下,AI大模型的商业化压力日益增大。某些大模型的API调用价格大幅降低,甚至部分版本宣布对外完全免费。面对如此巨额的投入,创业公司难以承受。李开复认为,未来只有大厂才有能力做超大模型。国内AI独角兽企业,如月之暗面、百川智能、MiniMax等,虽然融资额不菲,但与国外巨头相比仍显逊色,且面临资金链吃紧的困境。

在商业化压力下,AI大模型创业公司开始探索不同的战略路径。零一万物放弃了对超大参数规模模型的追求,转而专注轻量化、高性能的模型。其新旗舰模型Yi-Lightning采用混合专家(MoE)架构,激活参数仅200多亿,但表现超越GPT-4,训练成本仅为GPT-4的三十分之一。同样,DeepSeek-V3也成为开源模型的新宠,其训练成本大幅降低,API调用价格更低,吸引了大量开发者。

智谱AI、阶跃星辰等企业则继续投入基础模型研发,强化多模态和复杂推理能力,并探索C端应用场景。月之暗面与MiniMax在C端市场表现强劲,月之暗面的智能助手Kimi和全平台月活跃用户超过3600万,MiniMax的视频模型海螺AI和海外版Talkie也聚拢了大批用户。

百川智能则独辟蹊径,将AGI与医疗结合,推出了“一大四小”医疗产品,并与儿童医院合作,探索“制造医生”的AGI之路。这些不同的技术路线和商业化路径,让AI大模型创业公司开启了不同的发展方向,而随着竞争的加剧,这种战略分化也将进一步加速。