阿里发布Qwen3-Max-Thinking模型，性能比肩国际顶尖，推理能力创新高-峰会-巨人天成财经

阿里正式推出其最新旗舰推理模型——千问Qwen3-Max-Thinking，该模型在多项权威评测中刷新全球纪录，成为国内最接近国际顶尖水平的AI大模型，性能表现可与GPT-5.2和Gemini 3 Pro相媲美。

作为阿里规模最大、能力最强的千问推理模型，Qwen3-Max-Thinking拥有超过万亿参数，并基于36T Tokens的预训练数据构建。通过极致扩展总参数、强化学习及推理计算规模，新模型在科学知识、数学推理和代码编程等关键性能基准测试中取得突破性进展，刷新多项全球纪录。

在推理能力提升方面，千问团队创新性地引入测试时扩展（Test-time Scaling）机制。该机制突破传统推理计算中简单增加并行路径的局限，通过“经验提取”方式对过往推理结果进行提炼，实现多轮自我迭代。这一设计使模型在相同上下文中完成更高效的推理计算，显著提升性能与效率。例如，在“人类最后的测试”（HLE）中，Qwen3-Max-Thinking以58.3分的成绩超越GPT-5.2-Thinking的45.5分和Gemini 3 Pro的45.8分，创下当前所有模型的最高分。

面向智能体（Agent）时代需求，Qwen3-Max-Thinking进一步强化了自主调用工具的原生Agent能力。通义团队在完成初步工具使用微调后，通过规则奖励与模型奖励联合强化学习训练，使模型具备智能结合工具进行思考的能力。在QwenChat平台上，用户可体验模型自主调用搜索、个性化记忆和代码解释器等核心Agent工具，获得专业级回答。这种自适应工具调用机制不仅提升了回答的智能性与流畅度，还大幅降低模型幻觉，为解决复杂任务提供可靠支持。

目前，开发者可通过QwenChat平台免费体验Qwen3-Max-Thinking模型，企业用户可通过阿里云百炼获取API服务，普通用户则可通过千问PC端和网页端直接试用。千问App即将完成新模型接入，届时所有用户均可免费体验这一国内最强AI大模型的强大能力。