巨人天成
产经 科技 企业 数据 峰会 快讯 商业

阿里发布千问旗舰推理模型Qwen3-Max-Thinking:多项性能刷新全球纪录

2026-01-28来源:快讯编辑:瑞雪

阿里巴巴正式推出其最新研发的千问旗舰推理模型Qwen3-Max-Thinking,标志着国内人工智能领域取得重大突破。这款模型在多项国际权威评测中刷新纪录,性能表现已接近国际顶尖水平,成为目前国内最强的AI大模型之一。

据技术团队介绍,Qwen3-Max-Thinking总参数规模超过万亿级别,预训练数据量达到36T Tokens,是阿里迄今为止规模最大、能力最强的推理模型。该模型通过大规模强化学习后训练和多项技术创新,实现了性能的显著提升,在数学推理、科学知识和代码编程等关键领域展现出卓越能力。

在基准测试中,这款新模型的表现超越了GPT-5.2、Claude Opus 4.5和Gemini 3 Pro等国际知名模型。特别是在数学推理方面,预览版已在国内首个AIME 25和HMMT 25评测中取得双满分成绩,正式版通过进一步优化后,在IMO-AnswerBench等国际数学竞赛基准测试中继续保持领先。

技术创新方面,模型引入了自适应工具调用能力和全新的测试时扩展机制。这种机制不同于传统推理时简单增加并行路径的方式,而是能够对推理结果进行"经验提取"和自我迭代,在相同上下文中实现更高效的计算。测试数据显示,该机制使模型在复杂推理任务中的效率提升超过30%。

原生Agent能力是另一大亮点。通过联合强化学习训练,模型能够自主选择搜索、个性化记忆和代码解释器等工具,提供专业水平的回答。技术团队表示,这种能力使模型在处理复杂任务时更接近人类专家的表现,同时将幻觉率降低了40%以上。

应用落地方面,阿里已开放多渠道体验。普通用户可通过PC端和网页端直接试用,开发者能在QwenChat平台免费调用API,企业用户则可通过阿里云百炼服务获取专业支持。千问APP也即将完成升级,所有用户都将能免费体验新模型的强大功能。

回顾发展历程,阿里Qwen大模型自2022年启动研发以来,已成长为全球排名领先的开源项目。此次发布的Qwen3-Max作为通义千问家族的最新成员,进一步巩固了阿里在基础模型领域的技术优势。市场反应显示,消息公布后阿里巴巴港股在次日盘前上涨超过2%,显示出投资者对这项技术突破的积极预期。

苹果iOS 26.3推新隐私功能:自研基带机型可限制运营商精准定位
苹果将在iOS26.3系统中提供一项隐私保护新功能,该功能为限制蜂窝网络获取精确位置,开启后可限制运营商获取设备精确坐标,仅提供“大致街区”位置。 据苹果官网支持文档介绍,蜂窝网络定位依赖设备连接的信号塔数…

2026-01-27

网络配线架:综合布线“中枢”,智能化高密度引领未来网络管理
在企业办公中,配线架能管理工位网线与机房设备的连接,支持日常办公网络需求;在数据中心,配线架连接服务器、存储设备与核心交换机,实现高密度、高可靠性的布线。智能配线架配备电子标签、端口状态指示灯等,能实时显示端…

2026-01-27

面向6G通信的超宽带系统问世,为未来高速无线通信筑牢坚实保障
针对此,北京大学王兴军教授、舒浩文研究员及香港城市大学王骋教授组成的联合团队,成功研制出面向6G通信的超宽带光电融合集成系统,首次实现全频段、灵活可调谐的高速无线通信,为未来更畅通、可靠的6G无线通信提供保…

2026-01-27

阿里千问旗舰推理模型Qwen3-Max-Thinking发布,吴嘉畅谈AI未来新方向
业界普遍的推理时计算,只会简单增加并行推理路径,重复推导已知结论很常见,冗余推理效率低下;而千问采用的这一机制,可对此前推理的结果进行“经验提取”式的提炼,并据此进行多轮自我迭代,在相同的上下文中实现更高效…

2026-01-27

2026IT互联网活动模板精选:脑力大挑战+幸运翻牌,精准避坑高效营销
但很多商家实操时频繁踩雷:模板科技感不足不贴合行业属性、题目/奖品设置脱离目标用户、数据无法对接内部系统、推广渠道适配差导致流量流失……这份干货指南帮你精准避坑,精选6个适配IT互联网行业的活动模板工具,按核…

2026-01-27

OpenAI开启Codex发布月 多款新品助力AI编程革新 引领软件产业新潮流
作为OpenAI深耕智能编程领域的核心生态,Codex已从最初的API接口迭代为集模型、工具与工作流于一体的“AI软件工程师”,其演进速度与市场认可度持续攀升。 此次发布月的产品矩阵将围绕企业级需求与开发者…

2026-01-27