巨人天成
产经 科技 企业 数据 峰会 快讯 商业

阿里开源ZeroSearch,大模型搜索超越谷歌,成本大降80%!

2025-05-09来源:华尔街见闻编辑:瑞雪

近日,科技巨头阿里巴巴向公众揭开了一款革命性的大模型搜索引擎——ZeroSearch的神秘面纱。

ZeroSearch是一种创新的强化学习框架,它无需依赖真实的搜索引擎,即可激发大模型的搜索潜能。这一技术充分利用了大模型在海量数据预训练过程中累积的深厚知识库,将其转化为一个高效的检索模块。该模块能够根据用户的搜索查询,智能生成相关内容,并且还能动态调整生成内容的质量,这一特点是传统搜索引擎所无法比拟的。

为了验证ZeroSearch的性能,研究人员在包括NQ、TriviaQA、PopQA、HotpotQA等在内的七大问答数据集上进行了全面测试。测试结果显示,采用70亿参数的监督微调模型在ZeroSearch的加持下,搜索能力达到了33.06的高分,而140亿参数的模型更是取得了33.97的优异成绩,超越了谷歌搜索的32.47分。

在成本效益方面,ZeroSearch同样展现出显著优势。研究人员通过SerpAPI使用谷歌搜索进行约64,000次搜索查询的训练,所需成本高达586.70美元。相比之下,在四个A100 GPU上利用140亿参数的大模型进行模拟训练,成本仅为70.80美元,成本降幅超过80%。

检索增强生成(RAG)技术近年来已成为解决大模型幻觉问题和扩大知识范围的标配。然而,早期的RAG主要依赖基于提示的策略,这些方法对提示的要求较高,且高度依赖于模型的推理能力。尽管有研究尝试通过监督微调、蒙特卡洛树搜索等方法来增强搜索能力,但这些方法算力消耗巨大,在实际应用中面临诸多挑战。

随着DeepSeek-R1、o1等模型的涌现,强化学习成为提升模型逻辑推理能力的关键。这些模型无需明确的逐步监督,完全依赖于奖励驱动的学习机制。受此启发,越来越多的研究开始将强化学习应用于大模型搜索中。

例如,Search-R1通过强化学习自主生成多个搜索查询,而ReSearch则利用强化学习教授模型通过搜索进行推理,无需对中间推理步骤进行监督。但这些方法需要与谷歌等商业搜索引擎配合使用,才能达到最佳效果,成本高昂。

相比之下,ZeroSearch通过强化学习激励大模型的搜索能力,同时避免了与真实搜索引擎交互带来的高昂成本和不可控因素。它采用轻量级监督微调的方式,将大模型转化为检索模块。这一过程不仅利用了大模型预训练中的知识积累,还通过调整提示中的关键词,灵活控制生成文档的质量,为后续训练提供多样化的检索场景。

为了实现这一目标,研究人员收集了大量与真实搜索引擎交互的轨迹数据,并进行了标注和微调。他们让大模型与真实搜索引擎进行多轮交互,直至得出最终答案,并详细记录所有交互轨迹。这些轨迹涵盖了从模型发起查询、搜索引擎返回文档,到模型生成最终答案的全过程。接着,对这些轨迹进行细致标注,将能产生正确答案的轨迹标记为正样本,导致错误答案的轨迹归为负样本。

基于正样本和负样本交互轨迹中提取的查询-文档对,研究人员对大模型实施了轻量级监督微调。在微调过程中,他们巧妙调整提示中的少量词汇,如加入“有用信息”“噪声信息”等,引导大模型学习生成不同质量的文档。同时,将输入问题及其对应答案融入提示内容,进一步拓宽大模型的知识边界。

ZeroSearch还引入了“课程学习机制”,在训练过程中逐步调整生成文档的质量。随着训练的进行,逐渐增加任务的难度,使模型从简单的检索场景开始,逐步适应更具挑战性的环境。通过一个概率函数动态调整生成噪声文档的可能性,迫使模型在训练过程中不断提升其推理能力和鲁棒性。

在强化学习的框架下,ZeroSearch采用了近端策略优化、组相对策略优化等多种算法来优化模型的搜索策略。奖励函数的设计专注于答案的准确性,采用基于F1分数的奖励机制,以平衡精确度和召回率。为了提高训练的稳定性,ZeroSearch还引入了损失掩蔽机制,确保梯度仅针对模型自身的输出进行计算。

ZeroSearch的训练模板采用多轮交互结构,明确区分了模型的推理、搜索和回答阶段。这种结构化的模板不仅提高了模型的透明度,还增强了其在实际应用中的可靠性。随着ZeroSearch技术的不断成熟和推广,有望为搜索引擎领域带来一场深刻的变革。

企业禁用无线网卡攻略:三种方法详解,第二种助企业高效管控风险
对于中大型企业或对数据安全要求高的单位,域智盾终端安全管理系统提供了更智能、更彻底、更可追溯的无线网卡管控方案。在Windows专业版或企业环境中,IT人员可以用系统自带的组策略(Group Policy…

2025-11-15

蓝牙耳机被他人连接别慌!三招轻松夺回“控制权”
当发现耳机被别人连接时,最直接的解决方法是重置连接。操作很简单:先打开你的手机蓝牙设置,找到已配对的耳机名称,选择“忽略此设备”或“取消配对”。最后,在手机蓝牙列表中找到你的耳机并重新点击连接即可。这个操作…

2025-11-15

工业通信新选择:环网交换机如何以冗余设计保障现场数据稳定传输
每个交换机上有两个用于组环的端口(网口),交换机之间通过手拉手形式构成了环形的网络拓扑。我们设计的千兆工业交换机整体设计采用“凹陷”网口设计,外观上和普通交换机大有差别,将网线水晶头能够有力的支撑保护住。 …

2025-11-14

安科瑞ASCB3-80m智能微断:全参量监测+远程操控,筑牢低压配电安全防线
智能微型断路器配合智能网关使用,对用电线路的关键电气参数,如电压、电流、功率、温度、漏电、能耗等进行实时监测,具有远程操控、异常预警、事故跳闸告警、电能计量统计、故障定位等功能。ASCB3-80m 系列智能…

2025-11-14

谷歌AI新动作与苹果不谋而合,隐私赛道上苹果技术路线获印证
过去几个月里,我得出一个结论:苹果在AI方面的困境真正令人失望的地方,并不仅仅是人们普遍认为它在当前AI趋势中"落后"了。 A:苹果确实错过了ChatGPT发布引发的AI变革浪潮,在大语言模型产品方面相比其…

2025-11-13

物联网+AI赋能制造业边坡:构建“工业大脑”实现安全与效率双提升
物联网 + AI 构建的 “工业大脑”,通过全维度感知、智能化分析、精准化决策,让边坡管理实现了从 “事后补救” 到 “预测性维护” 的根本性转变,不仅破解了安全与效率、投入与效益的平衡难题,更重塑了制造业…

2025-11-13

广电卡适配指南:哪些手机能用?这些旗舰机型可能不兼容!
华为P50系列是个特例,即便是4G版,也能通过软件方案支持广电5G。中国广电表示,近六年主流手机型号均已升级适配广电网络,98%以上的新入网5G手机支持700MHz频段。 判断你的手机是否适配广电卡,不仅…

2025-11-13

星闪智联引领未来:无线短距通信开启智能社会新篇章
为统一目标、保证质量,在国际星闪联盟组织与号召下,联盟领导、行业协会及合作伙伴的11位代表上台发起了《消费电子新短距产业共建倡议》,明确提出要“共建星闪技术新标准、共创智能连接新应用、共赢消费电子新未来”。 …

2025-11-13

Kernelcom“智能键盘”来袭:12.5英寸超宽屏,AMD/Intel双版本可选
快科技11月12日消息,近日一款名为Kernelcom的设备正在Kickstarter上众筹,虽然其本质上是一款功能完备的笔记本电脑,但制造商还是将其宣传为“智能键盘”。 这款设备最大的特点是其12.5英寸超…

2025-11-13