巨人天成
产经 科技 企业 数据 峰会 快讯 商业

谷歌Gemini 2.5 Pro模型再升级,AI性能基准测试评分大幅提升

2025-06-06来源:ITBEAR编辑:瑞雪

近期,谷歌在人工智能领域再次迈出重要步伐,先后推出了Gemini 2.5 Pro和Gemini 2.5 Flash两个模型版本。虽然它们都仍处于预览阶段,但谷歌的行动表明其在AI技术上的不断突破与探索。

早在今年3月底,谷歌就率先发布了Gemini 2.5 Pro模型,紧接着在4月,面向更广泛用户群体的轻量级版本Gemini 2.5 Flash也应运而生。尤为Flash版本已经通过Gemini App向全球用户开放体验,这无疑为更多用户提供了接触和了解先进AI技术的机会。

不仅如此,谷歌近期还对Google AI Studio中的Gemini 2.5 Pro预览版模型进行了更新(版本号为06-05)。此次更新后,谷歌声称该模型在多项AI性能基准测试中取得了显著进步。例如,在LMArena Elo评分中上升了24分,WebDevArena Elo评分更是跃升至1443分,从而在业界占据了领先地位。在高难度的GPQA和Humanity's Last Exam等测试中,Gemini 2.5 Pro也展现出了出色的表现。

针对此前Gemini 2.5 Pro预览版(05-06版本)用户反馈的模型性能短暂下滑问题,谷歌也给出了积极回应。他们表示,已经对模型进行了风格与结构上的优化,这不仅使模型更具创意,回答格式也更加清晰,从而极大地提升了用户的交互体验。

值得注意的是,谷歌近期还对Pro版用户的请求限制进行了放宽。这一举措或许预示着,在Gemini 2.5 Pro版本正式上线后,用户将能够享受到更加灵活且可能更具吸引力的价格策略。这无疑为那些对AI技术充满热情并希望将其应用于实际场景中的用户提供了更多的选择和便利。

2025年末显卡市场大揭秘!15款显卡3DMark实测,精准定位你的选择
1 15款显卡横评作为显卡测试的标杆工具,3DMark自1998年来不断更新,截止目前已经非常完善,最新的测试项目增加了SpeedWay和Steel Nomad,他们和此前显卡评测一直用的测试项目有何区…

2025-12-18

咪帅冬季新品发布会:新品亮相引关注,烧友齐聚共体验
一个新兴HiFi品牌,咪帅,在12月13日发布了众多新品耳机,包含了各种形态,传统有线、蓝牙头戴、OWS、挂耳式等等,其实这牌子的调音是经过业内HiFi工程师和烧友们参与的,我听了几款蓝牙,声音确实和同类型…

2025-12-18

荣耀WIN系列双旗舰官宣!12月26日发布,10000mAh电池+旗舰芯成亮点
亓言纪语:对于荣耀WIN系列,亓纪的想法是这样的:看到10000mAh电池的爆料后,亓纪多少有点懵逼的,因为没有想到荣耀在电池方面会如此激进。和其他厂商不同,首款搭载10000毫安时电池的不是荣耀中低端机型…

2025-12-18

1.27亿广西南宁数实融合大单落定 京东力压群雄拔得头筹
10月27日,京东云4786万元中标北京防疫一体化平台大单,4541万元中标北海市政务云平台服务项目;11月10日,京东以7721亿元中标信科公司中国海油供应链数字化平台运维运营技术服务专有协议;12月8日…

2025-12-18

职场跃迁秘籍:掌握“能动性”思维,用AI工具突破能力瓶颈
未必总能成功,但如果成功了,你就有机会撰写自己的职位描述,并且你将是第一个(可能也是唯一的)申请人。你可以通过创建一个 Project(例如在ChatGPT 或 Claude 中),上传你过去从经理那里收…

2025-12-18

谷歌联合创始人布林通勤常与Gemini Live对话 称新版本即将上线
他举了一个开车时向 Gemini Live 提问的例子:“我打算建一座数据中心,需要多少兆瓦的这种电力、那种电力,总成本大概是多少。”谷歌于2024 年 5 月在谷歌 I/O 开发者大会上首次演示了这款产…

2025-12-18