阿里云近日宣布推出新一代大语言模型Qwen3.6-Plus,这款千问3.6系列的首款模型被官方定位为"中国编程能力最强的AI模型"。该模型在编程、智能体协作及工具调用等核心领域实现突破性进展,标志着国产大模型在复杂任务处理能力上迈入新阶段。
在权威评测中,Qwen3.6-Plus展现出显著优势。该模型在SWE-bench编程任务测试、Terminal-Bench2终端编程评估及NL2Repo长程代码生成等专项评测中均位居榜首,同时在Claw-eval和QwenClawBench等智能体能力测试中超越同类产品。这些测试覆盖了从基础代码编写到复杂系统开发的全链条能力验证。
代理式编程(Agentic Coding)是该模型的核心创新点。实测显示,Qwen3.6-Plus可自主完成网页前端开发、大型代码库重构等复杂任务。其工作流程包括任务拆解、路径规划、自动测试和迭代优化,开发者仅需提供自然语言指令即可获得完整解决方案。这种能力使专业开发者效率提升数倍,同时让非技术人员也能通过对话完成编程任务。
多模态处理能力实现质的飞跃。基于原生多模态训练架构,模型可精准识别界面截图、设计文档中的视觉元素,并自动生成对应代码。在真实开发场景中,该能力支持从"界面理解-代码生成-工具调用"的完整闭环,例如根据手绘草图自动生成交互式网页,或通过界面截图修复代码漏洞。
上下文处理能力达到行业领先水平。模型支持百万词元级别的长文本理解,可高效处理技术文档、对话记录及大型代码库等海量信息。通过深度优化主流智能体框架,模型在开放环境中的任务完成率和稳定性显著提升,为构建自主智能系统奠定基础。
商业化应用方面,Qwen3.6-Plus已登陆阿里云百炼平台,提供标准化API接口。该服务兼容OpenAI和Anthropic的API规范,可无缝集成至主流编程工具链。定价策略显示,输入价格低至每百万Tokens 2元,在同类高性能模型中具有明显竞争力。普通用户可通过悟空、千问等APP直接体验模型能力。
据透露,千问3.6系列将采用"旗舰+开源"双轨策略。除本次发布的商业版本外,后续将开源不同参数规模的模型变体,构建完整的生态体系。更强大的Qwen3.6-Max模型正在研发中,预计将在近期推出,届时将带来新一轮技术升级。