巨人天成
产经 科技 企业 数据 峰会 快讯 商业

Allen人工智能研究所推出MolmoWeb:开源视觉网络智能体新选择

2026-04-03来源:快讯编辑:瑞雪

在人工智能领域,能够自主浏览网页并完成任务的智能体正成为研究热点。近日,Allen人工智能研究所(Ai2)推出了名为MolmoWeb的开源视觉网络智能体,这一成果为该领域带来了新的突破。作为Molmo 2模型家族的新成员,MolmoWeb以其独特的技术路径和开源特性引发了广泛关注。

MolmoWeb的最大亮点在于其开源属性。该模型提供了40亿和80亿参数两种版本,这种轻量化设计使其能够在本地设备上运行,大大降低了使用门槛。与市场上许多依赖专有技术的同类产品不同,Ai2团队选择了完全开放的道路,不仅公开了模型权重,还同步发布了训练数据、代码(即将上线)和评估工具,为研究人员提供了完整的研究框架。

在技术实现上,MolmoWeb采用了与众不同的训练方法。研究团队没有借助专有视觉智能体的知识蒸馏,而是通过两种途径构建训练数据:一是收集了30,000个人类操作轨迹,覆盖1,100多个网站的近600,000个子任务;二是利用可访问性树技术生成合成轨迹。这种组合方式既保证了数据的多样性,又解决了单纯依赖人工标注成本高昂的问题。训练数据中还包含了220多万个问答对,帮助模型理解网页内容。

实际性能测试显示,MolmoWeb在多个基准测试中表现优异。在浏览器操作任务中,它的表现超过了OpenAI的旧版GPT-4o模型,在开放权重模型中更是领先于Fara-7B和GLM-4.1V-9B等竞争对手。尽管与Anthropic、谷歌等公司的专有模型相比仍有差距,但MolmoWeb的开源特性使其成为研究社区的重要参考。

Ai2团队强调,他们的目标不是与商业巨头竞争,而是为学术界提供可复现的研究基础。当前网络智能体领域面临的一个关键问题是缺乏公开资源,这限制了研究的透明度和进展速度。MolmoWeb的发布,包括其庞大的训练数据集(包含带注释的网页截图和操作轨迹),为解决这一问题提供了重要资源。

目前,MolmoWeb的相关资源已在Hugging Face和GitHub平台开放下载。研究人员可以获取完整的模型架构、训练数据集以及评估工具包,这为深入理解网络智能体的工作原理和改进方向提供了宝贵机会。随着更多研究者基于这一开源框架开展工作,网络智能体技术有望迎来新的发展阶段。

广西举办机器人供需交流活动 搭建平台助力跨境合作与东盟市场开拓
活动以打造面向东盟的机器人典型应用场景为核心,汇聚政产学研用及东盟相关代表共250余人参会,搭建起精准高效的产业合作与跨境对接平台,为广西构建“北上广研发+广西集成+东盟应用”跨境产业链体系注入新动能。 活…

2026-04-03

数字化浪潮下,中国龙文化.cn平台引领龙文化传承与创新新路径
有相关数据显示,这些年我国龙文化相关产业规模每年都保持8%以上的增速,民俗体验、文创产品这些细分领域更是发展迅猛,但行业发展也有不少让人头疼的问题:传承方式太单一,大多靠线下展演、庙会这些传统形式,传播范围有…

2026-04-02

超算互联网携手多方启动“AGI4S算力共建计划” 共促科研范式变革
“AGI4S珠穆朗玛计划构建的科学智能创新中枢,与超算互联网今年稳步落实的‘超级科学计算智能体’全景图,具有相辅相成、互为促进的内在关系”,曹振南表示,AGI4S想要实现推动研究人员、研究工具、研究对象的协…

2026-04-02