Code Arena榜单更新：阿里Qwen3.7-Max编程能力跻身全球第二-科技-巨人天成财经

在AI编程能力评测领域，第三方大模型盲测平台LMArena旗下的Code Arena榜单更新引发关注。阿里最新旗舰模型Qwen3.7-Max以1541分的成绩跻身全球第二，成为唯一突破1540分的中国大模型，标志着中国在代码生成与理解领域的技术实力已跻身世界前列。

与传统代码基准测试不同，Code Arena的评测机制更具挑战性。该榜单由全球开发者自主命题，要求参评模型从零构建完整的可交互Web应用，再通过用户对匿名模型生成结果的盲测投票综合评分。这种"实战化"的评测方式，更贴近真实开发场景，对模型的代码生成质量、逻辑完整性和用户体验提出了更高要求。

作为面向智能体（Agent）场景优化的模型，Qwen3.7-Max在编程能力上实现了突破性提升。其核心优势在于能够独立完成复杂项目的端到端交付，支持长达35小时的持续运行，并可处理累计超过1000次工具调用的复杂长程任务。这种能力使其在自动化开发、智能系统构建等场景中展现出显著优势。

此次排名不仅验证了Qwen3.7-Max在代码生成领域的领先地位，更凸显了中国大模型在应对实际工程挑战时的技术积累。随着AI技术向专业化、场景化方向发展，这类具备长程任务处理能力的模型将在工业自动化、智能软件开发等领域发挥关键作用。

尚未公开发布的Claude Mythos Preview模型，在短短几周内，就在全球最重要的软件中找出了超1万个高危或严重漏洞。 UK AISecurity Institute（英国人工智能安全研究所）报…

2026-05-27

不同企业拥有各自的特点：有的通过自研的数智运营平台，实现全链路可视化和较为广泛的网络覆盖；有的依靠直营网络和明确的时效承诺，满足工程项目等对时间要求较高的运输需求；有的以较高的性价比和加盟体系，成为中小企业控…

2026-05-27

应急通信保障团队聚焦发射场、问天阁、任务专用专线等核心重保区域，提前72小时启动前置驻点保障与立体化巡检工作。据悉，神舟二十一号乘组计划乘坐神舟二十二号飞船于5月29日晚返回，截至发稿，甘肃电信已全面转入…

2026-05-27

在行业长期深陷进口IB价格高昂、RoCE大规模不稳的两难格局下，中科曙光scaleFabric全栈自研国产IB已实现批量出货与大规模商用落地，凭借原生无损RDMA架构，彻底打破传统技术路线桎梏，成为当前万卡…

2026-05-27

2026-05-27

2026-05-27

2026-05-27

2026-05-27

2026-05-27

2026-05-27