巨人天成
产经 科技 企业 数据 峰会 快讯 商业

阿里千问Qwen3-Coder-Next发布:低推理成本赋能高效编程智能体新突破

2026-02-04来源:快讯编辑:瑞雪

阿里巴巴千问团队近日正式发布了一款面向编码代理与本地开发场景的开放权重语言模型——Qwen3-Coder-Next。该模型通过创新架构与训练方法,在编程能力与推理效率之间实现了突破性平衡,为开发者提供了更高效的智能编程工具。

基于Qwen3-Next-80B-A3B-Base架构,研发团队采用混合注意力机制与MoE(专家混合)架构,构建了新一代智能编程模型。通过大规模可执行任务合成、环境交互反馈与强化学习技术,模型在降低推理成本的同时,显著提升了代码生成与智能体交互能力。训练过程中突破传统参数扩展模式,重点强化智能体训练信号的扩展性,采用四阶段优化策略:首先在代码与智能体数据集上进行持续预训练,随后通过高质量智能体轨迹数据监督微调,接着针对软件工程、QA、Web/UX等领域开展专家训练,最终将多领域能力蒸馏至单一可部署模型。

在编程智能体基准测试中,该模型展现出强劲竞争力。使用SWE-Agent框架时,在SWE-Bench Verified基准上取得超过70%的准确率,在多语言环境及更具挑战性的SWE-Bench-Pro测试中保持领先。特别值得注意的是,尽管激活参数规模仅为3B,其性能已可媲美参数量高10-20倍的开源模型,在TerminalBench 2.0和Aider等基准测试中同样表现优异。

效率与性能的平衡优化成为该模型的核心优势。测试数据显示,在SWE-Bench-Pro基准上,3B激活参数的Qwen3-Coder-Next与参数量大数十倍的模型性能相当,在低成本智能体部署场景中占据帕累托前沿。这种突破得益于训练方法对长程推理、工具使用和错误恢复能力的针对性强化,使模型更适应真实开发环境中的复杂需求。

目前,该模型已通过ModelScope和Hugging Face平台开放下载,开发者可自由获取模型权重进行本地部署与二次开发。研发团队表示,后续将持续优化模型的推理决策能力,扩展任务支持范围,并根据用户反馈快速迭代更新,为智能编程领域提供更强大的技术支撑。

马斯克再布局:SpaceX收购xAI,为超级IPO铺路估值达1.25万亿美元
据CCTV国际时讯报道,美国东部时间2月2日,美国企业家、亿万富翁马斯克旗下的太空探索技术公司(SpaceX)发表声明,宣布已收购同属于马斯克旗下的人工智能企业xAI公司。xAI公司同时也发表声明,证明已“…

2026-02-04

科创创业人工智能ETF工银588430开盘上扬,重仓股多数飘红新易盛领涨
来源:新浪基金∞工作室 2月3日,科创创业人工智能ETF工银(588430)开盘涨1.39%,报1.165元。科创创业人工智能ETF工银(588430)重仓股方面,新易盛开盘涨4.10%,中际旭创涨2.71%…

2026-02-04

知识付费选平台别盲从!四大工具适配不同阶段,助你精准破局私域运营
无论是行业干货分享、写作陪伴、职场进阶指导,还是小众兴趣圈层运营,只要创作者能提供独特的圈层价值,就能通过知识星球实现变现 ——这里的核心逻辑不是 “卖课程”,而是 “运营圈子”,平台抽成较高的短板,也能通…

2026-02-04

OLED屏搭配M6芯片!新款MacBook Pro或2026年Q4登场 成本难题待解
据最新报告显示,新款便携式Mac预计将于2026年第四季度面世,但最新信息表明,OLED面板的唯一供应商三星尚未开始大规模生产这一核心组件。此前有报道称,三星在显示屏生产方面进度超前,表明苹果在推出重新设计的…

2026-02-04

高通自研Oryon CPU核心架构师Gerard Williams III离职,未来开发存变数
快科技2月3日消息,NUVIA创始人、高通自研Oryon CPU首席架构师Gerard WilliamsIII宣布离职,结束他在高通四年的职业生涯。在入职苹果公司后,Gerard Williams III成…

2026-02-04