阿里发布Qwen3-Max-Thinking：超万亿参数刷新纪录，推理性能与Agent能力双飞跃-数据-巨人天成财经

阿里云正式推出其迄今为止规模最大、性能最强的千问系列推理模型——Qwen3-Max-Thinking。该模型总参数量突破万亿级，预训练数据规模达36T Tokens，在多项核心指标上实现全球领先，标志着国产大模型技术迈入新阶段。

在性能突破方面，Qwen3-Max-Thinking通过参数规模扩展与强化学习优化，在19项国际权威基准测试中刷新纪录。该模型不仅在数学推理领域斩获AIME 25和HMMT 25国内首个双满分，更在复杂推理、指令遵循、人类偏好对齐等维度达到国际顶尖水平。特别是在启用工具的"人类最后测试"（HLE）中，以58.3分超越GPT-5.2-Thinking（45.5分）和Gemini 3 Pro（45.8分），创下当前所有模型最高分。

技术架构创新方面，模型引入全新测试时扩展机制，通过"经验提炼-自我迭代"的推理范式，显著提升计算效率。传统推理路径常出现重复推导现象，而新机制可对历史推理结果进行结构化提炼，在相同上下文窗口内实现多轮智能迭代。这种突破使模型在保持高性能的同时，推理成本降低30%以上，为大规模商业化应用奠定基础。

针对智能体（Agent）应用场景，模型特别强化了原生工具调用能力。在QwenChat交互界面中，用户可直观体验模型自主选择搜索、个性化记忆、代码解释器等核心工具的能力。通过规则奖励与模型奖励联合训练体系，模型能根据任务需求智能组合工具使用策略，回答准确率提升40%，幻觉问题减少25%，在专业领域表现接近人类专家水平。

开发者可通过QwenChat平台免费体验模型能力，企业用户可登陆阿里云百炼平台获取API服务。千问官方APP即将完成模型接入升级，届时所有用户均可通过PC端、网页端及移动端免费使用。目前平台已开放数学推理、代码生成、多轮对话等场景的测试接口，支持中文、英文等多语言交互。

阿里千问Qwen3-Max-Thinking正式登场！高效推理新路径，实测能力抢先看

智东西1月27日报道，昨晚，阿里巴巴推出了Qwen3-Max-Thinking，这是阿里千问系列目前能力最强的旗舰级推理模型，在19项权威基准测试中，Qwen3-Max-Thinking跟GPT-5.2-T…

2026-01-27

2024连云港企业获客新路径：百度智能营销解锁精准转化新密码

全链路智能营销：本地企业的数字化转型实战方案百拓基于百度生态体系，为连云港企业提供从品牌建设、效果投放到达成转化的整合服务。百拓建议连云港企业重点关注三方面：首先利用百度地图商户标识强化地理半径内的精准…

2026-01-27

微博×益普索：2026冬奥热点趋势洞察，社交互动与消费新机遇并存

2026年米兰科尔蒂纳冬奥会开幕在即，微博与益普索联合发布的《2026冬奥热点趋势洞察白皮书》上篇，基于社交大数据与消费者调研，揭示了冬奥相关的社交热点趋势与消费机遇。调研显示，60.1%的用户会通过社交…

2026-01-27

紫金矿业：拟巨额收购扩张版图商业布局与投资动态全解析

2026-01-27

A股“神秘力量”现身控盘，沪指横盘半月，市场方向抉择即将来临？

2026-01-27

三大指数探底回升全线飘红，半导体领涨太空光伏反弹，热点轮动下如何布局？

2026-01-27

白银价格狂飙：投资银条受热捧，工业需求激增加剧供需失衡

2026-01-27

DeepSeek-OCR 2模型发布，概念股短线活跃宏景科技等多股强势上涨

2026-01-27

鄂产新型P300无人机海外亮相，普宙全球化战略启航产能攀升

1月22日，位于武汉东湖高新区高科创新产业园的普宙科技，工程师在测试新型P300轻型无人机编队飞行。本月初，该机在美国国际消费电子展上发布，与50余位行业用户达成合作意向。2025年，普宙正式启动全球化战略…

2026-01-27

2026中国机博会与武汉工博会：聚焦制造本源，解锁技术跃迁新密码

展会聚焦智能制造的核心支点：那些真正决定产线韧性、精度与响应力的技术环节。展会尚未启幕，但技术演进的脉络早已清晰：真正的智能制造，不在云端幻影，而在机床震颤的频率里，在焊缝凝固的纹路中，在伺服电机毫秒级的…

2026-01-27