多模态视觉语言测评：Gemini-3-pro登顶国内多款大模型表现亮眼-产经-巨人天成财经

近日，SuperCLUE-VLM多模态视觉语言基准测评12月总榜正式揭晓，全球多款主流大模型在基础认知、视觉推理、视觉应用三大核心维度展开激烈角逐，最终谷歌Gemini-3-pro以绝对优势登顶榜首，国内多款模型凭借技术突破跻身前列，展现出中国人工智能领域的强劲实力。

谷歌Gemini-3-pro以83.64分的总成绩领跑全场，其在三项细分指标中均表现卓越：基础认知得分89.01分，视觉推理82.82分，视觉应用79.09分，三项数据均远超其他竞品。这一成绩不仅巩固了谷歌在多模态领域的领先地位，也为行业树立了新的技术标杆。

国内阵营中，商汤科技SenseNova V6.5 Pro以75.35分位居第二，成为榜单中排名最高的国产模型。字节跳动旗下两款模型表现亮眼：豆包大模型以73.15分跻身前三，其视觉版在基础认知环节得分82.70分，甚至超越部分国际竞品，仅在视觉推理环节稍显不足；另一款模型则凭借均衡表现稳居前列。百度ERNIE-5.0-Preview、阿里巴巴Qwen3-vl等模型也成功进入前五，其中Qwen3-vl作为榜单中首个开源且总分超70分的模型，为开源社区贡献了重要技术资产。

国际头部模型在此次测评中表现分化。Anthropic的Claude-opus-4-5以71.44分位列第六，而OpenAI的GPT-5.2(high)仅获69.16分，排名相对靠后。这一结果反映出，尽管国际巨头在通用人工智能领域占据先发优势，但国内模型通过针对性优化和垂直场景深耕，正在逐步缩小技术差距。

据测评机构介绍，本次评估从基础认知能力、复杂视觉推理、实际应用场景适配性三个维度展开，覆盖图像理解、逻辑推断、跨模态交互等关键技术指标。评测数据显示，国内模型在中文语境下的语义理解、文化相关视觉内容处理等方面表现突出，而国际模型则在多语言支持、通用场景泛化能力上保持优势。随着技术迭代加速，多模态大模型正从实验室走向实际应用，在医疗、教育、工业检测等领域展现出巨大潜力。

国信证券护航钢研功能：全国首批科创可转债落地加速国产替代进程

2025-12-31

12月30日ETF动态：有色产业ETF吸金超27亿科创50ETF资金流出超8亿

2025-12-31

豪威集团拟全球发售4580万股H股 2026年1月12日港交所开售

2025-12-31

空气能热泵供暖“稳定器”：缓冲水箱作用及选型全解析

如果没有缓冲水箱，气体就会在系统中积存，造成主机有时出现流量开关故障和高压报警等问题，影响系统的正常运行。在实际工程中，我们应根据具体情况选择合适的方法来确定缓冲水箱的容量，为热泵供暖系统打造一个稳定、高效的…

2025-12-31

Meta豪掷数十亿收购Manus，AI智能体发展现状与未来走向几何？

今年3月，Manus火爆出圈，邀请码在二手平台一度被炒到五万元；5月，Manus拿到Benchmark的7500万美元B轮融资；7月，Manus撤出中国市场，裁员后剩下40余名核心技术人员迁往新加坡总部；12…

2025-12-31

中科迪宏在济发布工业AI智能体中台助力制造业转型升级

当前工业大模型已从概念探索迈向场景落地阶段，但数据孤岛、模型精度不足、ROI评估难仍是行业痛点，智能体作为连接大模型与工业场景的“桥梁”，其价值在于将抽象的AI能力转化为企业可感知的业务实效，中科迪宏采取的“…

2025-12-31

“华科系”创业力量崛起：肖弘Manus引Meta重金收购，校友硬核出圈

天使投资人、资深人工智能专家郭涛向时代周报记者分析表示，这一转变的背后，是全球科技竞争进入看重“效能”与“落地能力”的白热化阶段。正如“大疆系”创业者的崛起，这家成立于2006年的科技企业，凭借对技术与产品…

2025-12-31

柬埔寨沉香：独特香韵与稀缺资源铸就中高端至高端市场地位

2025-12-31

JD-CSC智能扭力扳手：任务下发精准执行数据蓝牙回传助力工业4.0

数据实时上传：扳手在完成扭矩施加后，通过蓝牙4.0/5.0协议自动将实测扭矩值、峰值扭矩、施加时间、操作人ID、设备编号等数据上传至配套终端（手机、平板或电脑），传输延迟≤1秒，确保数据及时性。防错与报…

2025-12-31

Meta豪掷数十亿收购Manus，AI智能体商业化落地迈出关键一步

2025-12-31

多模态视觉语言测评：Gemini-3-pro登顶 国内多款大模型表现亮眼

多模态视觉语言测评：Gemini-3-pro登顶国内多款大模型表现亮眼