巨人天成
产经 科技 企业 数据 峰会 快讯 商业

全球AI编程大模型盲测揭晓,阿里Qwen3.6-Plus成中国编程模型佼佼者

2026-04-03来源:快讯编辑:瑞雪

在AI编程能力的全球竞技场上,中国科技企业再次展现强劲实力。国际权威盲测平台LMArena旗下Code Arena榜单最新一期结果显示,阿里巴巴自主研发的Qwen 3.6-Plus大语言模型以1452分的成绩跃居全球第二,成为该榜单中排名最高的中国大模型。这一突破性成果标志着国产AI模型在工程化开发领域已具备与国际顶尖技术正面竞争的实力。

作为AI领域最具公信力的评测体系之一,LMArena通过真实用户盲测和实时对抗机制构建评价体系。其React专项榜单聚焦AI模型在复杂Web开发场景中的自主编码能力,要求模型独立完成从项目初始化到调试运行的全流程开发。这种评测方式突破传统代码补全测试的局限,更强调工程思维与端到端开发能力的综合考察,被视为当前AI Coding领域最具挑战性的技术方向。

Qwen 3.6-Plus于4月2日正式发布,凭借原生多模态理解与推理能力,在代码生成和Agent技术方面表现尤为突出。该模型在多项权威编程评测中持续领先,以更少的参数量实现超越GLM-5、Kimi-K2.5等参数量翻倍甚至三倍模型的性能表现。此次在React榜单中,Qwen 3.6-Plus以4分优势领先OpenAI最新发布的GPT-5.0-High,与Anthropic旗下Claude-Opus-4.6-Thinking的差距缩小至88分,展现出国产模型在工程化开发领域的显著进步。

在Code Arena综合榜单中,Qwen 3.6-Plus同样稳居国产模型首位。这一成绩推动阿里巴巴在全球AI实验室排名中升至第四位,紧随Anthropic、OpenAI和Google之后。值得注意的是,该模型发布首日即在开发者社区引发强烈反响,次日便以黑马姿态冲入React榜单前三,其快速迭代能力与技术落地效率获得行业高度认可。

据技术团队透露,Qwen 3.6-Plus作为千问3.6系列的首发模型,后续将开源多个不同参数规模的版本。性能更强的旗舰模型Qwen3.6-Max已进入最终测试阶段,预计将于近期正式发布。这一系列布局显示阿里巴巴正通过开源生态建设与前沿技术研发双轮驱动,持续巩固其在AI工程化领域的领先地位。

6G时代加速到来:从技术试验到生活变革,未来已触手可及
在4G、5G时代,手机是人们对移动互联网终端的普遍认知,而到了6G时代,眼镜、耳机、手表、汽车等各类智能设备都能成为终端,丰富的终端形态为6G时代的生活带来无限想象空间。陈岩说,通过6G网络可以连接工厂中数以…

2026-04-03

Allen人工智能研究所推出开源MolmoWeb:小尺寸网络智能体展现新可能
让MolmoWeb在众多网络智能体中脱颖而出的不仅是其小尺寸,还有一个事实:Ai2并没有通过从专有的基于视觉的智能体进行蒸馏来训练模型。 不过,大体而言,来自Anthropic、谷歌、OpenAI等公司的专…

2026-04-03

数智力量绘就三晋新画卷——中国移动山西公司“十五五”赋能发展纪实
山西公司数智集成中心新行业总监刘亚军介绍,传统AI模型在煤矿场景单矿训练需5000张以上高质量样本、耗时长达1个月,而此次项目依托数十座煤矿沉淀的海量数据构建通用基础模型,将单一场景训练数据量降至100张左右…

2026-04-03

边缘计算与云计算:一文读懂两者差异及“云边端协同”新趋势
自动驾驶汽车开进隧道,哪怕没信号,它的车载边缘计算单元照样得在毫秒间决定刹不刹车——这种“将在外,君命有所不受”的自主权,是边缘计算最硬核的本事。逻辑: 在工厂内部的边缘节点实时分析机器振动数据或产品照片,…

2026-04-03

吉林大学团队借AI技术预测出潜在高温超导材料 开启多元氢化物研究新篇
中新网长春4月2日电 (记者 郭佳)吉林大学物理学院钟鑫等研究人员近日在三元氢化物镧硼氢体系的高压结构预测与实验研究中取得重要进展。 钟鑫进一步介绍,在理论结构预测方面,研究团队在100至200吉帕压力范围内…

2026-04-03