巨人天成
产经 科技 企业 数据 峰会 快讯 商业

OpenAI开源超稀疏模型Circuit-Sparsity:0.4B参数量解锁AI可解释性新路径

2025-12-16来源:快讯编辑:瑞雪

OpenAI近日开源了一款名为Circuit-Sparsity的新型人工智能模型,该模型以极低的参数量和高度稀疏的权重矩阵,为解决大语言模型(LLM)的"黑箱"问题提供了全新思路。这款参数量仅0.4B的模型,其权重矩阵中99.9%的元素为零,仅保留0.1%的关键连接,这种设计使其内部计算路径变得清晰可追踪。

传统大模型普遍存在"概念纠缠"现象,单个神经元往往需要同时处理多个完全不同的任务,导致模型决策过程难以解释。OpenAI团队通过强制权重稀疏化,使每个神经元仅与特定神经元建立连接,从而在模型内部构建出类似电路的清晰计算路径。研究显示,在处理字符串闭合检测任务时,模型仅用12个神经元就构建出完整电路,每个神经元分别承担检测单引号、双引号或计数嵌套深度等特定功能。

技术实现层面,研究团队采用动态剪枝技术,在训练过程中持续保留绝对值最大的权重连接;通过AbsTopK激活函数强制保留前25%的激活值;同时用RMSNorm替代传统归一化层,避免破坏稀疏结构。这些创新使模型在保持性能的同时,电路规模较密集模型缩减16倍,显著降低了AI系统的理解难度。实验证明,移除电路关键节点会导致模型性能崩溃,而移除非关键节点则影响微弱,验证了电路设计的有效性。

尽管稀疏模型在可解释性方面表现突出,但其计算效率存在明显短板。由于稀疏矩阵运算无法利用GPU的Tensor Cores加速,实际运算速度比密集模型慢100-1000倍。针对这一瓶颈,研究团队提出"桥梁网络"方案,通过编码器-解码器结构在稀疏模型与预训练密集模型间建立映射关系。这种设计允许研究人员在稀疏模型上修改特定特征,再将扰动映射回密集模型,从而实现对现有大模型的解释性干预。

该研究在学术界引发广泛讨论。部分专家认为这项技术可能颠覆现有混合专家模型(MoE)的设计范式,将权重隔离到特定"专家"的传统做法或将被直接构建稀疏模型取代。也有观点指出,稀疏模型的训练成本较密集模型高出两个数量级,当前技术更适用于研究场景而非实际应用。OpenAI团队承认现有局限,但表示正在探索从密集模型中提取稀疏电路的技术路径,以及开发更高效的训练方法。

开源项目已同步发布在GitHub和Hugging Face平台,包含完整模型代码和训练日志。技术论文详细披露了动态剪枝、激活稀疏化等核心算法的实现细节,以及电路验证实验的完整数据。研究团队强调,这项工作尚处于早期探索阶段,未来计划将技术扩展至更大规模模型,并开发配套分析工具,使AI系统的评估与调试更加透明化。

OpenAI高管称:人类打字速度成通用人工智能发展“隐性掣肘”
【环球网科技综合报道】12月15日消息,据《商业内幕》报道,OpenAI Codex 产品开发负责人 AlexanderEmbiricos日前表示,通用人工智能(AGI) 目前“被低估的限制因素”是“人类…

2025-12-16

解锁机器人未来新可能:黑芝麻智能SesameX平台深度剖析
为了在真实环境中实现安全与自主并存,SesameX将复杂的安全需求抽象为六层安全机制,从物理行为一直延伸到数据与系统安全,形成由下而上的整体防护结构。 覆盖视觉、定位、融合、规划、控制、语言与多模态等多类…

2025-12-16

彩虹-7无人机西北首飞成功!大展弦比飞翼布局,性能卓越未来可期
每经记者:孔泽思 每经编辑:廖丹 12月15日每经讯 12月15日,《每日经济新闻》记者从航天彩虹(SZ002389,股价23.57元,市值232亿元)了解到,近日,彩虹-7高空高速长航时无人机在西北某机场成…

2025-12-16

广德美食热潮中,电信科技护航打造丝滑网络体验
中国电信安徽公司实力宠粉,全程科技护航,不管你是拍视频、开直播,还是晒朋友圈九宫格,信号一路满格、流畅不掉线,更有空中巡航,AI智能调度,给你安全极致的网络体验。 面对打卡人潮与直播间扎堆开播的双重压…

2025-12-16

Open RAN浪潮下:戴尔PowerEdge如何筑牢未来网络坚实底座?
为此,戴尔不仅提供符合OpenRAN验证要求的新一代PowerEdge服务器,更通过全生命周期自动化管理、规模化部署能力以及深厚的生态集成经验,为沃达丰提供了一套稳定、可持续、可扩展的基础设施底座。 …

2025-12-16

智能垃圾箱市场:规模扩张、机遇涌现与挑战并存(2024-2031年)
其核心功能还包括通过物联网模块将桶内垃圾容量、分类数据、设备状态等信息实时上传至云端管理平台,便于市政或清洁部门优化清运路线、预测垃圾量并实现精准调度。 根据QYResearch最新发布的《2026-2032…

2025-12-16

KHX50矿用避雷器:多重防护保障煤矿通信安全,模块化设计降低维护成本
是专为煤矿井口及井下通信线路设计的防雷保护设备,具备高防护等级、多重保护机制、模块化设计及合规性保障等核心优势,适用于煤矿等恶劣环境下的通信线路保护。 1.煤矿井口通信线路保护:安装于通讯线路进入设备箱的入…

2025-12-16

vivo S50系列登场:不拼参数拼体验,影像性能续航全兼顾
性能上,S50和S50 Pro mini的区分也很清晰。 S50 Promini则更激进一些,直接上了第五代骁龙8,搭配LPDDR5X和UFS 4.1的存储组合,小屏但性能不缩水,这点在现在的市场里并不多…

2025-12-16

智能车ETF泰康(159720)12月15日收跌 份额规模双降流动性待提升
规模方面,截止12月12日,智能车ETF泰康(159720)最新份额为6781.24万份,最新规模为5675.89万元。股票代码股票名称持仓占比持仓股数(股)持仓市值(元)300750宁德时代16.70%2.…

2025-12-16