巨人天成
产经 科技 企业 数据 峰会 快讯 商业

全球AI编程大模型盲测新榜揭晓,阿里Qwen3.6-Plus跻身全球第二中国第一

2026-04-04来源:快讯编辑:瑞雪

在AI编程能力的全球竞技场上,中国科技企业再次交出一份亮眼成绩单。阿里巴巴最新发布的大语言模型Qwen 3.6-Plus,在权威盲测平台LMArena旗下Code Arena榜单中斩获React专项第二名,成为首个在该领域超越国际顶尖模型的中国大模型。这一突破性成果不仅刷新了国产模型的技术高度,更标志着中国AI在工程化应用层面实现重要跨越。

作为AI领域最具公信力的盲测平台之一,LMArena通过真实用户匿名评测、实时动态排名的机制,构建起全球大模型性能的"试金石"。其Code Arena榜单聚焦AI编程能力,在Agent技术浪潮下愈发受到行业关注。本次评测的React专项被视为当前AI代码生成领域的技术制高点,要求模型在无人干预的条件下,独立完成从项目初始化到调试运行的全流程开发,对工程思维和端到端能力提出严苛考验。

数据显示,Qwen 3.6-Plus以1452分的成绩紧追Anthropic的Claude-Opus-4.6-Thinking(1540分),领先OpenAI最新发布的GPT-5.0-High达4分,较Google的Gemini 3.1 Pro Preview更是高出12分。这种以更小参数量实现更优性能的表现,在权威编程评测中已成常态——千问3.6系列此前已在多项测试中超越参数量数倍于己的GLM-5、Kimi-K2.5等模型,确立了国产模型在代码生成领域的标杆地位。

该模型于4月2日正式发布后,立即在全球开发者社区引发强烈反响。其原生支持的多模态理解与推理能力,配合在代码生成和Agent任务中的突出表现,使阿里在全球AI实验室排名中跃升至第四位,形成与Anthropic、OpenAI、Google三强鼎立的竞争格局。特别值得关注的是,Qwen 3.6-Plus在全面评估AI编程能力的Code Arena总榜中,同样位居国产模型首位。

据研发团队透露,此次发布的Qwen 3.6-Plus仅是千问3.6系列的首款模型。按照规划,后续将陆续开源不同参数规模的版本,并计划于近期推出性能更强的旗舰模型Qwen 3.6-Max。这种"基础模型+开源生态+旗舰产品"的立体化布局,预示着中国AI企业正在构建覆盖全场景的技术矩阵,为全球开发者提供更具竞争力的解决方案。

智能织物新突破:衣服化身AI伙伴,感知交互开启穿戴新纪元
未来,你的外套可能就是用这种纤维编织而成,它本身就是一台柔软的、可穿着的计算机,负责处理来自衣物各处的传感信号,并执行复杂的计算任务。衣物上的声学织物或触觉传感器会捕捉到你的意图,并将信号通过“拓扑公路”传递…

2026-04-04

阿尔忒弥斯2号升空遇两难题:通讯短暂异常 宇航员连夜修好厕所后小憩
经过地面团队与宇航员的通力合作,阿尔忒弥斯2号飞船在升空后的短短时间内所遭遇的两个技术问题均已得到妥善解决,确保了任务的顺利进行。 在排除了通讯故障和厕所问题后,四名宇航员开始了他们计划中的四个小时小憩。按照…

2026-04-04

AI浪潮下骨干网络“变形记”:训练与推理的连接新路径
骨干连接不再是将庞大数据集移动到(或在)少数几个计算位置之间,而是分发训练好的模型并连接支持推理工作负载的区域基础设施。骨干网络使运营商能够将训练好的模型从集中式训练集群移动到区域数据中心,在那里它们可以在…

2026-04-04

苹果AirPods Max 2迎固件更新:版本号8E251,新增功能或优化升级
IT之家 4 月 1 日消息,苹果今日为 AirPods Max 2 头戴耳机推送了全新固件,固件版本号为 8E251。据IT之家了解,AirPods Max 2 搭载 H2 芯片,相比前代 H1 芯片带来…

2026-04-04