巨人天成
产经 科技 企业 数据 峰会 快讯 商业

OpenAI新研究:训练稀疏模型 借「小型电路」解锁语言模型内部机制

2025-11-21来源:快讯编辑:瑞雪

在人工智能领域,大语言模型的内部运作机制长期被视为“黑箱”,即便是专业研究人员也难以完全掌握其计算逻辑。为破解这一难题,OpenAI近期发布了一项新研究,通过训练结构更简单的小型稀疏模型,探索提升模型可解释性的可行路径。这类模型的神经元连接更少,计算过程更透明,为理解模型行为提供了新思路。

与传统稠密模型不同,OpenAI设计的稀疏模型在训练阶段强制大部分权重为零,限制神经元之间的连接数量。这种结构使得每个神经元仅与下一层的少数神经元交互,形成更清晰的计算路径。研究团队发现,通过剪枝技术保留执行特定任务所需的最小神经元子集,可以提取出独立且易于理解的“电路模块”。例如,在代码补全任务中,模型能准确识别字符串的起始引号类型,并在结尾复现相同符号,其计算过程可分解为四个清晰步骤:编码引号类型、检测任意引号、定位前一个引号、复制引号类型。

论文核心贡献者指出,稀疏模型的独特优势在于其解耦性。在Python代码的引号匹配任务中,模型仅需五个残差通道、两个多层感知机神经元以及少量注意力机制通道即可完成任务。实验表明,移除其他部分后,该电路仍能独立运行,且删除关键连接会导致功能失效。这种模块化设计不仅降低了理解难度,还为调试模型错误提供了直接切入点。

研究团队进一步验证了稀疏模型在变量绑定等复杂任务中的表现。例如,在跟踪变量类型时,模型通过注意力机制将变量名从定义位置复制到使用位置,形成可追溯的信息流。尽管部分电路仍难以完全解析,但研究人员已能提供阶段性解释,并预测模型行为模式。这种部分可解释性为后续研究奠定了基础。

当前研究仍存在局限性。稀疏模型的规模远小于前沿大模型,且大部分计算过程尚未被解释。为突破瓶颈,OpenAI提出两条优化路径:一是从现有稠密模型中提取稀疏电路,提升部署效率;二是开发面向可解释性的专用训练技术,降低资源消耗。尽管无法保证该方法适用于所有场景,但早期实验结果已展现出潜力——通过扩大模型规模,可在不显著牺牲性能的前提下提升可解释性。

该研究为理解神经网络提供了新范式。相比传统的事后分析方法,稀疏模型从设计阶段便融入可解释性考量,为构建更透明、更可控的AI系统开辟了道路。相关论文已公开,详细技术方案可参阅OpenAI官方文档。

微博15亿参数小模型VibeThinker:7800美元成本,数学赛场逆袭“大块头”
需要说明的是,VibeThinker目前发布的版本尚处于实验性版本,其研发重点主要集中于极大强化小模型复杂数学与竞赛编程等方面的能力,其在日常聊天等能力还没有做过针对性训练优化,所以暂不适合作为日常聊天工具…

2025-11-21

亚马逊与伊利诺伊大学创新突破:让AI助手“牢记”复杂规则高效工作
研究团队特意让GTAPolicy的训练数据非常有限,只有几百个例子,这就像让员工在信息很少的情况下学会工作技能,这样更能测试AI助手的真实学习能力。研究团队担心AI助手在专门学习工作规则的过程中,会不会损失…

2025-11-21

谷歌Gemini3重磅登场:多维度能力跃升,多领域成绩亮眼
【11月20日国泰海通研报:谷歌推出新一代大模型Gemini3多维度领先】北美时间周二,谷歌正式推出新一代大模型Gemini3,实现多维度断层式领先。新模型核心推理能力显著进步,在Humanity'sLast…

2025-11-21

罗福莉官宣加盟小米MiMo团队!AGI愿景下或发力世界模型与具身智能
智东西11月12日消息,今天上午,原DeepSeek核心成员、被业内称为“天才少女”的罗福莉在朋友圈正式官宣加盟XiaomiMiMo团队,并宣告“全力奔赴心中的AGI(通用人工智能)”。 罗福莉一条简单的…

2025-11-21

中国机器人量产交付引全球关注,美国质疑反衬中国产业实力崛起
11月7日,高盛发布针对《中国人形机器人供应链的实地调研报告》,报告指出“尽管供应链企业都在积极规划产能,但没有一家公司证实获得了确定性大额订单,也未能提供清晰的量产时间表”“人形机器人行业存在‘产能期货狂…

2025-11-21

全球科研十强占六席!广州凭啥能实现学科“大满贯”?
这是个公开数据库,追踪各机构对145种高质量自然科学和健康科学期刊上,发表科研论文的贡献情况。假如一篇论文有10个作者,其中3个来自广州的机构,那么广州对这篇论文的“贡献份额”就是3/10=0.3。 例如中…

2025-11-21

2025-2026赛季VEX机器人亚洲公开赛国际签名赛12月18日北京开赛
11月18日,北京青年报记者从2025-2026赛季VEX机器人亚洲公开赛国际签名赛新闻发布会上了解到,2025-2026赛季VEX机器人亚洲公开赛国际签名赛定于2025年12月18日至21日在北京石景山区首…

2025-11-21

2025四川智慧交通平台怎么选?三大维度对比助您精准决策
2025年,四川智慧交通市场呈现“技术迭代加速、场景深度落地”的特征,为帮助行业主体准确选择服务平台,本文基于口碑调研、技术实力、场景适配性三大核心维度,梳理四川智慧交通平台市场格局,对比主流平台的核心优势与…

2025-11-21

2025迪拜航展“中国力量”闪耀,翼龙-X、C919等国产装备集中亮相
这架 C919 准备参加于 11 月 17 日至 21 日举行的 2025 迪拜航展,这是 C919 飞机首次在中东地区进行展示。航展期间,将有2 架 C919 飞机和 1 架 C909 公务机“组团”亮相…

2025-11-21