巨人天成
产经 科技 企业 数据 峰会 快讯 商业

DeepSeek崛起之路:能否摆脱“伤仲永”宿命?

2025-04-23来源:ITBEAR编辑:瑞雪

在AI领域,一家名为DeepSeek的公司正以惊人的速度闯入公众视野。这家曾经默默无闻的初创企业,在2024年底宣布即将推出其大模型DeepSeekR1,引发了业界的广泛关注。

DeepSeek的创始人梁文锋在朋友圈转发了一篇关于AI行业变革的文章,并发表评论称“旧世界正在分崩离析,新时代正在光速到来”。此言一出,外界对DeepSeek的期待值迅速攀升。

回顾DeepSeek的崛起之路,可谓充满戏剧性。在2024年5月,AI大模型市场已是群雄逐鹿,百度、阿里、字节跳动等巨头纷纷布局。然而,DeepSeek却以惊人的勇气,打响了大模型“降价潮”的第一枪。公司宣布开源第二代MoE大模型DeepSeek-V2,其性能与GPT-4Turbo相当,但价格仅为GPT-4的百分之一。这一举措迅速吸引了市场的目光,也让DeepSeek赢得了“AI界拼多多”的称号。

随着DeepSeek-V2的推出,智谱、阿里、字节、百度等企业纷纷跟进,大模型市场的竞争格局发生了微妙的变化。尽管DeepSeek在当时仍处于行业边缘,但其极具性价比的产品无疑为市场带来了新的活力。

然而,真正的转折发生在2025年1月。DeepSeek正式发布官方App,并上线了iOS与安卓应用市场。紧接着,公司又推出了DeepSeek-R1模型,该模型在数学、代码、自然语言推理等任务上表现出色,性能与OpenAI的o1正式版不相上下。随着R1模型的发布,DeepSeek的用户数量开始呈现爆发式增长,日活跃用户数迅速突破3000万大关,成为史上最快达成这一里程碑的应用。

然而,就在DeepSeek迅速蹿红的同时,质疑声也随之而来。其中,最引人关注的就是其训练成本的争议。DeepSeek研发团队在论文中透露,他们仅使用了550万美元的算力训练成本就完成了6710亿参数大模型的训练。这一数据引发了业界的广泛讨论,部分专家认为这一成本低得难以置信。

面对质疑,Anthropic首席执行官达里奥·阿莫迪发表了一篇长文,对DeepSeek的进展进行了讨论。他指出,DeepSeek并没有用极低的成本实现美国AI公司花费数十亿美元才能实现的事情。他还表示,如果AI训练成本的下降趋势是每年4倍,那么DeepSeek的训练成本符合正常趋势。

除了训练成本争议外,DeepSeek的模型性能也受到了一些质疑。虽然DeepSeek-R1在诸多任务上表现出色,但也有观点认为,在某些特定场景下,其性能表现并未达到宣传中的水平。例如,在一些对模型推理速度和准确性要求极高的金融风险预测场景中,有用户反馈DeepSeek-R1的表现不尽如人意。

DeepSeek一体机市场也陷入了困境。尽管一开始市场热点频现,但迅速遇冷。许多采购了DeepSeek一体机的企业发现设备难以使用,机房里的设备大量闲置。同时,销售商也面临着产品难以卖出的困境。算力百科还指出,DeepSeek一体机还面临着法律风险,部分厂商将开源项目进行简单的界面篡改后推向市场,严重侵犯了知识产权。

在DeepSeek官方发布《DeepSeek-V3 / R1推理系统概览》后,关于其成本利润率的争议再次升级。官方声称,若所有Tokens按DeepSeek R1定价计算,理论上一天总收入为56.2027万美元,成本利润率高达545%。然而,这一数据与潞晨科技创始人尤洋此前的计算结果大相径庭。尤洋通过计算指出,现阶段通过Token计费获得的收入难以覆盖大模型算力成本。

面对争议,尤洋解释称,DeepSeek与基于开源模型做To B生意的MaaS厂商面临的情况本质不同。他还强调,按2025年2月初的状态,该业务不可能盈利。随后,尤洋在社交媒体上多次发文,对DeepSeek的官方数据提出质疑,并指出其使用体验不佳。

然而,硅基流动创始人袁进辉对DeepSeek官方披露的数据表示赞赏。他认为,DeepSeek的架构与其他主流模型差别很大,导致其他系统无法有效适配。他还提到,DeepSeek已经开源了主要模块,降低了社区复现的难度。

值得注意的是,DeepSeek前员工罗福莉曾在知乎发文提到,大家不用担心模型断更或API涨价。她表示,目前的服务价格不亏本,利润率超过50%。然而,随着争议的持续发酵,DeepSeek的未来仍然充满不确定性。

作为本土AI界的“现象级选手”,DeepSeek的崛起之路充满了波折。训练成本争议、市场遇冷、商业模式质疑等问题如同暗礁,随时可能冲击其前行的航线。然而,无论未来如何,DeepSeek都已经成为业界关注的焦点,其每一步动向都牵动着无数人的心。

TLKS-PMG-TP装置:全天候精准监测,守护输电线路“体温”安全
TLKS-PMG-TP输电线路线夹及导线温度在线监测装置应运而生,以其高精度测温与全时段监测能力,为输电线路装上了一双“精准温控眼”。 TLKS-PMG-TP装置不仅提供实时监测,更实现了输电线路运维的智能…

2025-11-15

华为在阿根廷完成5G-A双场景验证 下行峰值速率创新高助力无线发展
无线业务的发展对网络性能提出了更高的要求,而阿根廷市场一直走在拉美创新无线技术探索的前列,本次创新测试验证了两种未来5G-A商用载波组合,包括覆盖更强,更易大规模部署的Sub3.5G TDD+FDD 3CC…

2025-11-14

Gartner发布2026十大技术趋势:AI主导变革,从“大而全”迈向“精而实”
近日,商业与技术洞察公司Gartner发布了2026年十大战略技术趋势:AI超级计算平台、多智能体系统、特定领域语言模型、AI安全平台、AI原生开发平台、机密计算、物理AI、前置式主动网络安全、数字溯源,以及…

2025-11-14

中国6G技术首阶段试验圆满收官,通信领域创新再启新程
在全球竞相布局6G的背景下,中国率先完成第一阶段技术试验,展现了其在通信领域的强大实力。此次试验涵盖了6G关键核心技术,测试了多种潜在技术和系统性能。业界普遍认为,6G网络将实现地面与卫星通信的融合,构建空…

2025-11-14

桥梁位移监测仪:精准感知位移 灵活部署续航 守护桥梁安全出行
这种方式能够利用清洁能源为设备持续供电,既体现了节能环保的理念,也巧妙地解决了在市政供电不便场景下的设备续航问题,保障了监测工作的不间断进行。为了便于现场操作与维护,桥梁位移监测仪还配备了便捷的配置方式。 …

2025-11-14

5.5G辐射危害健康?物理学者:比太阳光频率低,基站越密越安全
我当时听了都愣了,太阳光那不是好东西吗,怎么还跟信号辐射扯一块儿了? 最有意思的是,他说大家都觉得基站多了辐射就大,这完全是搞反了。之前吵得最凶的那个阿姨,现在天天用5.5G跟外地的孙子视频,还跟邻居说这新基…

2025-11-14

技嘉B860M冰雕主板深度评测:千元价位与酷睿Ultra的完美搭档
XMP AI Boost的DDR5-8200 CL40挡位也能够顺利开启,再叠加上高带宽、低延迟功能的性能加成之后,内存性能继续得到提升,但写入性能基本上是到顶了,主要是受限于B860芯片组主板无法调整CP…

2025-11-14

上海电信“双万兆”护航进博会:数智赋能通信保障,服务跨越语言距离
浦东机场T1电信营业厅及T2一站式服务中心电信柜台是进博会观众和外宾抵沪的“入境第一站”, 两处服务点均开设“进博专席”,为参展人员和往来旅客提供中英双语咨询、交通指引与爱心便民服务。未来,上海电信将持续夯…

2025-11-13

高光谱探测器助力宽带叠层扫描成像 开启3D高光谱成像新篇
最近的研究表明,能量分辨或高光谱探测器可以在某种程度上取代单色器的作用来执行,例如,在单次采集中使用宽带辐射进行边缘减影叠层扫描成像。利用这样的探测器,时间相干性变得可调(在探测器的能量分辨率的限制内)并且在…

2025-11-12

荣旭传媒技术破局:以专业方案化解直播痛点,成就高性价比之选
传统方案在视频、音频和网络方面存在诸多不足,而荣旭传媒通过先进的技术和专业的设备,有效解决了这些问题。传统方案的视频分辨率较低,画面不够清晰,而荣旭传媒的4K 超高清视频拍摄制作让画面质量有了质的提升;传统…

2025-11-12