巨人天成
产经 科技 企业 数据 峰会 快讯 商业

谷歌AI掌舵人点赞!清华姚班校友新研究突破,现双双入职Meta

2025-11-21来源:快讯编辑:瑞雪

谷歌AI掌门人Jeff Dean近日点赞了一项突破性研究,这项由清华姚班校友钟沛林团队主导的嵌套学习(Nested Learning,简称NL)范式,为解决大语言模型长期存在的灾难性遗忘问题提供了新思路。研究团队提出的Hope模型在语言建模与长上下文任务中展现出显著优势,相关论文已被NeurIPS 2025接收。

传统深度学习模型采用扁平化参数更新模式,通过堆叠网络层数或扩大模型规模提升性能,但这种"暴力堆参"的方式已逐渐触及瓶颈。研究指出,当前主流的Transformer架构本质上是NL范式的简化版本,其线性层结构未能充分发挥多层级协同的潜力。NL范式借鉴人类大脑的记忆机制,将模型重构为嵌套式优化体系,不同层级以差异化频率更新,实现短期记忆与长期规律的分层管理。

该研究提出三大核心创新:深度优化器通过神经网络预判梯度变化,替代传统优化器的固定公式;自我修改模型使架构在训练中自主调整参数,无需人工干预;连续记忆系统将二元记忆结构升级为多尺度记忆链,不同模块分别处理实时细节与长期规律。这些创新最终凝聚为Hope模型,在760M至1.3B参数规模下,其语言建模能力与推理水平均超越Transformer等主流模型,在Wiki文本困惑度、物理常识推理等指标上表现尤为突出。

这项研究的背后站着一位特殊的清华姚班校友——钟沛林。这位2016届毕业生在高中时期已是国际信息学竞赛的明星选手,2012年代表雅礼中学夺得IOI金牌,与发小艾雨青并称"雅礼双子星"。哥伦比亚大学博士毕业后,他加入谷歌纽约研究院担任算法科学家,期间主导了嵌套学习范式的研究。如今这对双子星已先后入职meta,分别担任AI科学家与软件工程师,继续在人工智能领域开拓新方向。

嵌套学习范式的提出标志着深度学习架构的范式转移。通过模拟人类认知机制,该研究为模型持续学习、长上下文推理等难题提供了全新解决方案。当AI模型从静态计算网络进化为分层协作的智能系统,或许将开启真正具备终身学习能力的通用人工智能新时代。

AI泡沫争议不断?周鸿祎三大理由力证:泡沫中正孕育技术革命
文章给出一组数据,95%的公司用AI都在亏钱,OpenAI半年就烧了135亿,但英伟达的市值却被炒到了5万亿美元。这些基础设施就像2000年互联网泡沫留下的光纤和数据中心一样。 周鸿祎判断,我们正处在泡沫中…

2025-11-21

太空数据中心成新赛道:马斯克布局,谷歌跟进,中国公司亦展实力
11月2日,美国StarCloud公司成功发射搭载英伟达H100芯片与谷歌Gemini大模型的技术试验星。 据财联社,由于人工智能数据中心的能源消耗巨大,谷歌近日设想,将其张量处理单元(TPU)搭载在配备太…

2025-11-21

OpenAI发布GPT-5.1:沟通更自然,情绪价值拉满,付费用户可优先体验
此次推出的GPT5.1包含GPT-5.1Instant和GPT‑5.1Thinking两个模型,前者是一个常用模型,OpenAI介绍称,该模型更温暖、智能且更善于遵循用户指令,且在回答具挑战性的问题之前可以…

2025-11-21

百度世界大会亮点纷呈:AI成果升级,李彦宏畅谈智能生产力新未来
李彦宏在大会上表示,“我们用AI重构搜索结果页,不是简单地在搜索结果中插入AI摘要,而是把搜索从一个以文字内容和链接为主的互联网应用,转化为一个以图片视频等富媒体内容为主的AI应用。” 在李彦宏看来,AI数字…

2025-11-21

B站GET大会展现学习生态新貌:成教育机构布局增量重要阵地
目前,B站覆盖知识、科技、汽车、母婴等多元赛道,而AI从对话式演进到具身智能,也正是从二次元走向三次元的破壁;平台的推荐算法、内容生产工具、AIGC辅助能力,正在重塑内容供给方式,也为学习内容的丰富度与专业…

2025-11-21

宜宾兴文:无人机“飞播”油菜籽 科技赋能农业降本增效
在兴文县大河苗族乡环旦山村的油菜种植基地,无人机在空中匀速飞过,将油菜籽均匀撒入田地里。种植户张仲军流转了20亩土地种植油菜,按往年传统耕作方式计算,需要6名熟手忙好几天。 据悉,大河苗族乡预计今年栽种油菜…

2025-11-21

智源开放日共探具身智能新路径 携手伙伴构建产业协同新生态
在开放日上,产业人士探讨了端到端视觉语言模型(VLA)、分层式大模型、世界模型等不同技术路线的优劣。与会人士普遍认为,短期内,将任务规划、感知与控制解耦的“分层系统”在工程落地和稳定性上更具优势;而中长期,…

2025-11-21