巨人天成
产经 科技 企业 数据 峰会 快讯 商业

95后AI天才少女加盟小米!DeepSeek-V3爆火背后的性价比传奇

2024-12-29来源:创业资本汇编辑:瑞雪

在AI领域,一个名为DeepSeek的创新企业正迅速崛起,其最新发布的DeepSeek-V3大语言模型引发了国内外广泛关注。与此同时,DeepSeek背后的“天才少女”罗福莉也成为了众人瞩目的焦点。

DeepSeek-V3的发布,标志着DeepSeek在AI大模型研发方面取得了重大突破。据技术报告显示,该模型的参数量高达671B,激活参数为37B,使用的预训练token量更是达到了14.8万亿。在多项评测中,DeepSeek-V3的表现超越了阿里的Qwen2.5-72B和meta的Llama-3.1-405B等其他开源模型,甚至在性能上与顶尖的闭源模型如GPT-4和Claude-3.5-Sonnet不相上下。

尤为引人注目的是,DeepSeek-V3在训练效率和成本方面展现出了极高的性价比。据DeepSeek官方透露,整个训练过程仅用了不到280万GPU小时,相比之下,meta旗下的Llama-3405B模型则耗费了3080万GPU小时。如果以H800的租金为每GPU小时2美元来计算,DeepSeek-V3的总训练成本仅为600万美元左右,仅为Llama-3405B训练成本的十分之一。

而DeepSeek之所以能够在性价比方面取得如此优异的成绩,与其背后的技术创新密不可分。DeepSeek专注于开发先进的大语言模型和相关技术,通过创新的架构和算法,实现了更高效的训练和推理。例如,在DeepSeek-V2中,他们就采用了MLA(多头潜在注意力)和前馈网络方面的DeepSeekMoE架构等创新技术,从而在保证性能的同时降低了成本。

DeepSeek的创始人梁文锋,是一位毕业于浙江大学电子工程系的80后技术专家。他始终保持着低调的作风,和所有研究员一样,每天沉浸在“看论文、写代码、参与小组讨论”的工作中。正是这样的专注和投入,让DeepSeek在短时间内取得了如此显著的成果。

除了技术创新和性价比优势外,DeepSeek还以其开源和免费商用的特点赢得了市场的青睐。早在半年前发布的DeepSeek-V2,就因性能达到GPT-4级别但价格仅为GPT-4-Turbo的百分之一而引发了业内关注。这一举措不仅降低了用户的使用成本,也推动了AI技术的普及和应用。

而在DeepSeek-V3爆火之后,背后的“天才少女”罗福莉也进入了人们的视野。据媒体报道,小米创始人雷军以千万年薪招揽了这位DeepSeek开源大模型的关键开发者之一,让她领导小米AI大模型团队。罗福莉本科就读于北京师范大学计算机专业,硕士毕业于北京大学计算语言学专业。她在学术方面有着深厚的造诣和丰富的经验,曾在人工智能领域顶级国际会议ACL上发表多篇论文。

罗福莉的加入,无疑为小米在AI大模型领域的发展注入了新的活力。小米近年来在AI领域持续发力,不仅组建了AI实验室大模型团队,还成立了专门的AI平台部,由元老级技术大牛张铎负责。他们正在不断提升算力储备和技术优势,以开放的态度与合作伙伴开拓更多机会。

对于小米而言,如何在烧钱的大模型业务中平衡成本,无疑是雷军考虑的核心问题。而罗福莉拥有DeepSeek-V2的研发背景,无疑为小米在成本控制和性能优化方面提供了宝贵的经验和支持。她的加入,将助力小米在AI大模型领域取得更加显著的成果。

WebRTC技术赋能物联网卡:解锁工业医疗驾驶毫秒级低时延通信新路径
WebRTC(网页实时通信)技术与物联网卡的深度融合,正通过 “协议优化 + 硬件适配 + 网络升级”,破解毫秒级响应难题。本文基于行业实践,解析 WebRTC 技术原理、物联网卡协同路径及场景落地效果,为…

2025-11-13

智慧公安大数据云平台:以科技赋能警务,构建城市安全治理新生态
通过公安云平台,各类警务数据得以高效整合与流转,实现了从“人海战术”向“数据驱动”的转变。一键式可视化报警设备的引入,进一步拓宽了公众参与治安治理的渠道,实现接警员与报警人视频对讲、现场信息实时推送,为快速处…

2025-11-13

昕锐CL系列激光测距模块:定制化驱动低空经济场景变革新引擎
结语:定制化,是技术普惠的终极路径当测距模块从“标准化商品”进化为“场景化服务”,昕锐CL系列不仅解决了无人机与吊舱的“精准降本”难题,更重新定义了技术与需求的关系:技术突破的价值,不在于参数的堆砌,而在于…

2025-11-13

企业展厅多媒体设备保养指南:从日护到年检的分层维护策略
企业展厅多媒体设备保养频率需按“基础养护+定期检查+深度维护”分层设定,核心频率为每日、每周、每月、每季度,部分设备需年度专业维保。检查设备开机状态,测试核心功能(显示、音响、互动响应)是否正常。 请专业人…

2025-11-13

2025网购流量卡选购指南:不同场景实测教你选到网速稳的好卡
所以,简单概括一下:一张正规的网购流量卡,其网速表现与同运营商的线下套餐并无本质差异。 在流量卡领域,我认为“便宜”不一定直接等于“网速差”。•警惕“物联卡”冒充手机流量卡

2025-11-13

苹果设备与电信流量卡全攻略:从兼容到技巧,助你畅享无忧网络
•运营商网络覆盖差异•手机版本支持频段不同•套餐类型与设备性能不匹配最新的iPhone 14系列甚至已经支持电信的5GSA组网,网速体验绝对令人惊艳!

2025-11-12

2025金砖大赛大数据分析赛项落幕 多元力量共促数智化人才培养新篇章
新道科技助理总裁唐梦彬在致辞中表示,大赛把企业数智化转型过程中的业务模式、典型场景与大数据分析技术相结合,体现行业和企业对人员技能的最新标准,让师生深入了解当前数智化企业的运营和管理模式,提升大数据分析的理…

2025-11-12

量子安全网络新突破:CV-QKD可插拔模块开启高效规模化部署新篇
CUbIQ Technologies:开发了 CV-QKD 收发模块和量子安全架构HPE Juniper网络:将模块集成到其路由平台中,实现量子安全 MACsec 加密Coherent 高意:提供 400…

2025-11-12