巨人天成
产经 科技 企业 数据 峰会 快讯 商业

AI大模型商业化挑战加剧,六小虎2025年能否跨越生死线?

2025-01-10来源:ITBEAR编辑:瑞雪

随着人工智能领域的飞速发展,AI大模型正经历着前所未有的变革与挑战。近期,曾被誉为“AI大模型六小虎”之一的零一万物,在行业内引发了广泛关注。据报道,这家曾经的独角兽企业已不再执着于训练超级大模型,转而与阿里云携手成立了“产业大模型联合实验室”,其大部分训练和AI基础设施团队已并入该实验室。此举标志着国内首家AI大模型企业公开调整了战略方向。

零一万物的转型,不禁让人思考:这是否会是AI大模型创业公司“中途变道”的序幕?大模型行业的“摩尔定律”——扩展定律(Scaling Laws)是否已触及天花板?在追求通用人工智能(AGI)的技术梦想与实现商业化落地之间,创业公司该如何平衡与抉择?

面对这些灵魂拷问,零一万物CEO李开复在接受采访时直言:“仅仅一年多的时间,传统扩展定律的边际收益已明显递减,商业化同样如此。对于初创公司而言,投入巨额资源训练超大参数规模的模型,性价比极低,显然不是务实之选。”这一观点再次引发了行业对于扩展定律的广泛讨论。

扩展定律最早由OpenAI提出,它指出AI大模型的性能会随着模型参数规模、训练数据量和计算资源的增加而提升。受此理论影响,国内外大模型平台纷纷斥巨资购买GPU,提升计算能力,将模型参数规模推至数千亿甚至上万亿。然而,近年来,扩展定律的有效性开始受到质疑。据外媒报道,OpenAI的下一代模型(代号Orion)在某些任务上的改进微乎其微,与GPT-3到GPT-4的飞跃相比,提升幅度显著缩小。尽管OpenAI CEO否认了这一说法,但GPT-5的迟迟未推出,仍让外界猜测纷纷。

与此同时,Google旗下的Gemini 2.0也未能达到预期目标,Anthropic的Claude 3.5 Opus发布时间一再推迟。然而,并非所有人都认为扩展定律已失效。英伟达CEO黄仁勋在CES 2025上表示,基础模型预训练的扩展定律仍然有效,并出现了后训练扩展定律和测试时间扩展定律。其中,“测试时计算”为提升AI性能开辟了新途径,如OpenAI的o3模型能在推理过程中进行计算,通过“思考更长时间”解锁新能力。

尽管存在不同声音,但行业普遍认为,单纯依靠堆算力、堆参数的粗暴发展模式已成过去。高昂的成本导致边际效益严重递减,投入产出比成为企业不得不考虑的现实问题。近年来,大模型训练成本飙升,从2017年的数百美元到2023年的数千万美元甚至上亿美元,五年间成本增长了数十万倍。国内大厂如字节跳动、百度、阿里、腾讯等,都在筹划搭建万卡甚至十万卡GPU集群,采购成本高昂。

在此背景下,AI大模型的商业化压力日益增大。某些大模型的API调用价格大幅降低,甚至部分版本宣布对外完全免费。面对如此巨额的投入,创业公司难以承受。李开复认为,未来只有大厂才有能力做超大模型。国内AI独角兽企业,如月之暗面、百川智能、MiniMax等,虽然融资额不菲,但与国外巨头相比仍显逊色,且面临资金链吃紧的困境。

在商业化压力下,AI大模型创业公司开始探索不同的战略路径。零一万物放弃了对超大参数规模模型的追求,转而专注轻量化、高性能的模型。其新旗舰模型Yi-Lightning采用混合专家(MoE)架构,激活参数仅200多亿,但表现超越GPT-4,训练成本仅为GPT-4的三十分之一。同样,DeepSeek-V3也成为开源模型的新宠,其训练成本大幅降低,API调用价格更低,吸引了大量开发者。

智谱AI、阶跃星辰等企业则继续投入基础模型研发,强化多模态和复杂推理能力,并探索C端应用场景。月之暗面与MiniMax在C端市场表现强劲,月之暗面的智能助手Kimi和全平台月活跃用户超过3600万,MiniMax的视频模型海螺AI和海外版Talkie也聚拢了大批用户。

百川智能则独辟蹊径,将AGI与医疗结合,推出了“一大四小”医疗产品,并与儿童医院合作,探索“制造医生”的AGI之路。这些不同的技术路线和商业化路径,让AI大模型创业公司开启了不同的发展方向,而随着竞争的加剧,这种战略分化也将进一步加速。

TLKS-PMG-TP装置:全天候精准监测,守护输电线路“体温”安全
TLKS-PMG-TP输电线路线夹及导线温度在线监测装置应运而生,以其高精度测温与全时段监测能力,为输电线路装上了一双“精准温控眼”。 TLKS-PMG-TP装置不仅提供实时监测,更实现了输电线路运维的智能…

2025-11-15

华为在阿根廷完成5G-A双场景验证 下行峰值速率创新高助力无线发展
无线业务的发展对网络性能提出了更高的要求,而阿根廷市场一直走在拉美创新无线技术探索的前列,本次创新测试验证了两种未来5G-A商用载波组合,包括覆盖更强,更易大规模部署的Sub3.5G TDD+FDD 3CC…

2025-11-14

Gartner发布2026十大技术趋势:AI主导变革,从“大而全”迈向“精而实”
近日,商业与技术洞察公司Gartner发布了2026年十大战略技术趋势:AI超级计算平台、多智能体系统、特定领域语言模型、AI安全平台、AI原生开发平台、机密计算、物理AI、前置式主动网络安全、数字溯源,以及…

2025-11-14

中国6G技术首阶段试验圆满收官,通信领域创新再启新程
在全球竞相布局6G的背景下,中国率先完成第一阶段技术试验,展现了其在通信领域的强大实力。此次试验涵盖了6G关键核心技术,测试了多种潜在技术和系统性能。业界普遍认为,6G网络将实现地面与卫星通信的融合,构建空…

2025-11-14

桥梁位移监测仪:精准感知位移 灵活部署续航 守护桥梁安全出行
这种方式能够利用清洁能源为设备持续供电,既体现了节能环保的理念,也巧妙地解决了在市政供电不便场景下的设备续航问题,保障了监测工作的不间断进行。为了便于现场操作与维护,桥梁位移监测仪还配备了便捷的配置方式。 …

2025-11-14

5.5G辐射危害健康?物理学者:比太阳光频率低,基站越密越安全
我当时听了都愣了,太阳光那不是好东西吗,怎么还跟信号辐射扯一块儿了? 最有意思的是,他说大家都觉得基站多了辐射就大,这完全是搞反了。之前吵得最凶的那个阿姨,现在天天用5.5G跟外地的孙子视频,还跟邻居说这新基…

2025-11-14

技嘉B860M冰雕主板深度评测:千元价位与酷睿Ultra的完美搭档
XMP AI Boost的DDR5-8200 CL40挡位也能够顺利开启,再叠加上高带宽、低延迟功能的性能加成之后,内存性能继续得到提升,但写入性能基本上是到顶了,主要是受限于B860芯片组主板无法调整CP…

2025-11-14

上海电信“双万兆”护航进博会:数智赋能通信保障,服务跨越语言距离
浦东机场T1电信营业厅及T2一站式服务中心电信柜台是进博会观众和外宾抵沪的“入境第一站”, 两处服务点均开设“进博专席”,为参展人员和往来旅客提供中英双语咨询、交通指引与爱心便民服务。未来,上海电信将持续夯…

2025-11-13

高光谱探测器助力宽带叠层扫描成像 开启3D高光谱成像新篇
最近的研究表明,能量分辨或高光谱探测器可以在某种程度上取代单色器的作用来执行,例如,在单次采集中使用宽带辐射进行边缘减影叠层扫描成像。利用这样的探测器,时间相干性变得可调(在探测器的能量分辨率的限制内)并且在…

2025-11-12

荣旭传媒技术破局:以专业方案化解直播痛点,成就高性价比之选
传统方案在视频、音频和网络方面存在诸多不足,而荣旭传媒通过先进的技术和专业的设备,有效解决了这些问题。传统方案的视频分辨率较低,画面不够清晰,而荣旭传媒的4K 超高清视频拍摄制作让画面质量有了质的提升;传统…

2025-11-12