巨人天成
产经 科技 企业 数据 峰会 快讯 商业

95后AI天才少女助阵,DeepSeek大模型火爆全网,雷军千万年薪抢人才!

2024-12-29来源:证券时报e公司编辑:瑞雪

在AI界,一个名为DeepSeek的公司悄然崛起,其最新发布的大语言模型DeepSeek-V3迅速吸引了全球的目光。与此同时,一位95后的AI“天才少女”罗福莉也随之走入了公众的视野,她因在DeepSeek的关键角色而备受瞩目。

DeepSeek-V3凭借其卓越的性能,成功超越了多个知名开源模型,包括阿里的Qwen2.5-72B和meta的Llama-3.1-405B,甚至与世界顶尖的闭源模型如GPT-4和Claude-3.5-Sonnet不相上下。据技术报告显示,DeepSeek-V3的参数量高达671B,激活参数为37B,使用的预训练token量更是达到了14.8万亿。

令人惊讶的是,DeepSeek-V3在如此卓越的性能背后,却拥有极低的训练成本。据DeepSeek官方透露,整个训练过程仅用了不到280万GPU小时,相比之下,meta的Llama-3405B的训练时长则高达3080万GPU小时。若以H800的租金为每GPU小时2美元计算,DeepSeek-V3的总训练成本仅为不到600万美元,不及Llama-3405B训练成本的十分之一。

DeepSeek由国内量化资管巨头幻方量化于2023年创立,专注于开发先进的大语言模型和相关技术。其早在半年前发布的DeepSeek-V2就因性能达GPT-4级别,且开源、可免费商用、API价格极低而引发了业内关注。DeepSeek之所以能实现如此高的性价比,得益于其创新的架构,如MLA(多头潜在注意力)和前馈网络方面的DeepSeekMoE架构等。

DeepSeek不仅以高性价比的大模型赢得了市场的认可,还成为了国内大模型价格战的源头和推动者。在其发布DeepSeek-V2之后,字节、阿里、百度等厂商纷纷跟进降价。同时,DeepSeek也是中国互联网大厂以外,唯一一家储备了万张A100芯片的公司,为其技术研发提供了坚实的算力基础。

随着DeepSeek-V3的爆火,背后的AI“天才少女”罗福莉也备受关注。据报道,小米创始人雷军以千万年薪招揽了这位DeepSeek开源大模型DeepSeek-V2的关键开发者之一,让她领导小米AI大模型团队。罗福莉本科就读于北京师范大学计算机专业,硕士毕业于北京大学计算语言学专业,曾在阿里达摩院从事预训练语言模型相关工作,并在幻方量化和DeepSeek担任深度学习研究员。

罗福莉的加入,是小米全面发力AI大模型的一个重要举措。小米自2023年4月正式组建了AI实验室大模型团队以来,一直在不断挖掘AI相关的用户场景,并发挥自身技术优势,以开放的态度与合作伙伴开拓更多机会。为了支持大模型的研发,小米还正着手搭建自己的GPU万卡集群,并持续提升算力储备。

对于小米这样在手机和造车领域都讲究“性价比”的公司而言,如何在烧钱的大模型业务中平衡成本,无疑是雷军考虑的核心问题。而罗福莉因其在DeepSeek-V2研发中的出色表现,以及她对性价比的深刻理解,或许正是雷军看中她的原因。

WebRTC技术赋能物联网卡:解锁工业医疗驾驶毫秒级低时延通信新路径
WebRTC(网页实时通信)技术与物联网卡的深度融合,正通过 “协议优化 + 硬件适配 + 网络升级”,破解毫秒级响应难题。本文基于行业实践,解析 WebRTC 技术原理、物联网卡协同路径及场景落地效果,为…

2025-11-13

智慧公安大数据云平台:以科技赋能警务,构建城市安全治理新生态
通过公安云平台,各类警务数据得以高效整合与流转,实现了从“人海战术”向“数据驱动”的转变。一键式可视化报警设备的引入,进一步拓宽了公众参与治安治理的渠道,实现接警员与报警人视频对讲、现场信息实时推送,为快速处…

2025-11-13

昕锐CL系列激光测距模块:定制化驱动低空经济场景变革新引擎
结语:定制化,是技术普惠的终极路径当测距模块从“标准化商品”进化为“场景化服务”,昕锐CL系列不仅解决了无人机与吊舱的“精准降本”难题,更重新定义了技术与需求的关系:技术突破的价值,不在于参数的堆砌,而在于…

2025-11-13

企业展厅多媒体设备保养指南:从日护到年检的分层维护策略
企业展厅多媒体设备保养频率需按“基础养护+定期检查+深度维护”分层设定,核心频率为每日、每周、每月、每季度,部分设备需年度专业维保。检查设备开机状态,测试核心功能(显示、音响、互动响应)是否正常。 请专业人…

2025-11-13

2025网购流量卡选购指南:不同场景实测教你选到网速稳的好卡
所以,简单概括一下:一张正规的网购流量卡,其网速表现与同运营商的线下套餐并无本质差异。 在流量卡领域,我认为“便宜”不一定直接等于“网速差”。•警惕“物联卡”冒充手机流量卡

2025-11-13

苹果设备与电信流量卡全攻略:从兼容到技巧,助你畅享无忧网络
•运营商网络覆盖差异•手机版本支持频段不同•套餐类型与设备性能不匹配最新的iPhone 14系列甚至已经支持电信的5GSA组网,网速体验绝对令人惊艳!

2025-11-12

2025金砖大赛大数据分析赛项落幕 多元力量共促数智化人才培养新篇章
新道科技助理总裁唐梦彬在致辞中表示,大赛把企业数智化转型过程中的业务模式、典型场景与大数据分析技术相结合,体现行业和企业对人员技能的最新标准,让师生深入了解当前数智化企业的运营和管理模式,提升大数据分析的理…

2025-11-12

量子安全网络新突破:CV-QKD可插拔模块开启高效规模化部署新篇
CUbIQ Technologies:开发了 CV-QKD 收发模块和量子安全架构HPE Juniper网络:将模块集成到其路由平台中,实现量子安全 MACsec 加密Coherent 高意:提供 400…

2025-11-12