巨人天成
产经 科技 企业 数据 峰会 快讯 商业

梁文锋杨植麟大模型赛道再交锋,DeepSeek与Kimi谁将领跑?

2025-05-05来源:华尔街见闻编辑:瑞雪

在人工智能的大模型赛道上,两位业界佼佼者梁文锋和杨植麟再次狭路相逢。继今年2月两人的论文“撞车”事件后,4月30日,梁文锋领导的DeepSeek推出了数学定理证明专用模型DeepSeek-Prover-V2。

DeepSeek-Prover-V2的参数规模空前庞大,达到了6710亿,是前一代V1.5版本的近百倍。这一升级使得模型在数学测试集上的效率和正确率显著提升,miniF2F测试通过率高达88.9%,并成功解决了PutnamBench的49道题。这一成绩令人瞩目。

几乎在同一时间,杨植麟的月之暗面也推出了形式化定理证明大模型Kimina-Prover。该模型由Kimi团队与Numina联合研发,同样提供了开源版本。虽然Kimina-Prover在miniF2F测试上的通过率为80.7%,PutnamBench测试成绩为10道题,表现不俗,但在与DeepSeek-Prover-V2的对比中仍稍显逊色。

值得注意的是,两款模型的技术报告中都强调了强化学习的应用。DeepSeek的论文标题为《DeepSeek-Prover-V2:通过子目标分解的强化学习推进形式数学推理》,而月之暗面的论文则题为《Kimina-Prover Preview:基于强化学习技术的大型形式推理模型》。这显示了强化学习在数学定理证明领域的重要性。

梁文锋和杨植麟的再次“交锋”也引发了对两人及其公司面临的挑战的关注。DeepSeek在推出R1模型后,外界的关注度有所下降,同时面临着阿里巴巴等巨头的迅速追赶。而月之暗面的Kimi则正在与字节跳动的豆包和腾讯元宝等竞争产品激烈竞争。

在探讨AGI(通用人工智能)的实现路径时,梁文锋曾表示DeepSeek押注了数学和代码、多模态、自然语言三个方向。此次Prover-V2模型的推出,进一步强化了DeepSeek在数学和代码领域的实力,同时也保持了其模型矩阵的同步进化。

DeepSeek的代码系列模型Coder也经历了多次升级,从Coder-V2到DeepSeek-V2.5,再到V3和V3-0324,性能不断提升。而通用推理大模型R1则以低廉的价格和强劲的自然语言推理性能赢得了市场认可。

尽管DeepSeek和月之暗面作为明星初创公司备受瞩目,但它们也面临着来自大公司的巨大压力。腾讯元宝利用微信引流和大量投流,用户数量迅速增长,成为排名第三的AI产品。而阿里巴巴的新一代通义千问模型Qwen3则以更小的参数量和更全面的性能超越了DeepSeek-R1和OpenAI o1等产品。

百度同样是大模型领域的重要玩家。李彦宏在发布会上多次提及DeepSeek的局限性,并宣布百度将学习DeepSeek,在6月30日开源文心大模型4.5系列。这一举动显示了百度在大模型领域的决心和实力。

随着越来越多的玩家加入大模型开源竞赛,竞争愈发激烈。但只有技术最先进的玩家才能定义标准,引领行业发展。DeepSeek和月之暗面能否保持领先地位,让我们拭目以待。

在数学定理证明领域,DeepSeek-Prover-V2和Kimina-Prover的推出标志着AI技术在这一领域的重大突破。两款模型都利用了强化学习技术,提高了数学推理的效率和准确性。未来,随着技术的不断进步和应用场景的拓展,数学定理证明模型有望在更多领域发挥重要作用。

对于AGI的实现路径,DeepSeek的探索为我们提供了宝贵的启示。数学和代码作为AGI的天然试验场,具有封闭性和可验证性,是实现高智能的潜在途径。同时,多模态学习也是实现AGI不可或缺的一部分。未来,随着技术的不断融合和创新,我们有望看到更加智能、更加全面的AI系统的出现。

在激烈的竞争环境中,DeepSeek和月之暗面等初创公司需要不断创新和突破,以保持领先地位。同时,它们也需要与大公司展开合作与竞争,共同推动人工智能技术的发展和应用。

WebRTC技术赋能物联网卡:解锁工业医疗驾驶毫秒级低时延通信新路径
WebRTC(网页实时通信)技术与物联网卡的深度融合,正通过 “协议优化 + 硬件适配 + 网络升级”,破解毫秒级响应难题。本文基于行业实践,解析 WebRTC 技术原理、物联网卡协同路径及场景落地效果,为…

2025-11-13

智慧公安大数据云平台:以科技赋能警务,构建城市安全治理新生态
通过公安云平台,各类警务数据得以高效整合与流转,实现了从“人海战术”向“数据驱动”的转变。一键式可视化报警设备的引入,进一步拓宽了公众参与治安治理的渠道,实现接警员与报警人视频对讲、现场信息实时推送,为快速处…

2025-11-13

昕锐CL系列激光测距模块:定制化驱动低空经济场景变革新引擎
结语:定制化,是技术普惠的终极路径当测距模块从“标准化商品”进化为“场景化服务”,昕锐CL系列不仅解决了无人机与吊舱的“精准降本”难题,更重新定义了技术与需求的关系:技术突破的价值,不在于参数的堆砌,而在于…

2025-11-13

企业展厅多媒体设备保养指南:从日护到年检的分层维护策略
企业展厅多媒体设备保养频率需按“基础养护+定期检查+深度维护”分层设定,核心频率为每日、每周、每月、每季度,部分设备需年度专业维保。检查设备开机状态,测试核心功能(显示、音响、互动响应)是否正常。 请专业人…

2025-11-13

2025网购流量卡选购指南:不同场景实测教你选到网速稳的好卡
所以,简单概括一下:一张正规的网购流量卡,其网速表现与同运营商的线下套餐并无本质差异。 在流量卡领域,我认为“便宜”不一定直接等于“网速差”。•警惕“物联卡”冒充手机流量卡

2025-11-13

苹果设备与电信流量卡全攻略:从兼容到技巧,助你畅享无忧网络
•运营商网络覆盖差异•手机版本支持频段不同•套餐类型与设备性能不匹配最新的iPhone 14系列甚至已经支持电信的5GSA组网,网速体验绝对令人惊艳!

2025-11-12

2025金砖大赛大数据分析赛项落幕 多元力量共促数智化人才培养新篇章
新道科技助理总裁唐梦彬在致辞中表示,大赛把企业数智化转型过程中的业务模式、典型场景与大数据分析技术相结合,体现行业和企业对人员技能的最新标准,让师生深入了解当前数智化企业的运营和管理模式,提升大数据分析的理…

2025-11-12

量子安全网络新突破:CV-QKD可插拔模块开启高效规模化部署新篇
CUbIQ Technologies:开发了 CV-QKD 收发模块和量子安全架构HPE Juniper网络:将模块集成到其路由平台中,实现量子安全 MACsec 加密Coherent 高意:提供 400…

2025-11-12