巨人天成
产经 科技 企业 数据 峰会 快讯 商业

智谱GLM-4.7重磅上线:代码工具推理全升级,国产开源模型新标杆

2025-12-23来源:快讯编辑:瑞雪

在人工智能技术快速迭代的浪潮中,智谱公司推出的GLM-4.7大模型引发全球开发者关注。这款被定位为"智能体向"的开源模型,在代码生成、工具调用和复杂推理等核心能力上实现突破性进展,不仅在专业评测榜单中超越多个国际主流模型,更通过实际任务测试展现出强大的工程化潜力。

根据Code Arena最新发布的全球开发者编码盲测数据,GLM-4.7在Web开发领域位列第六,成为当前开源模型中表现最优的国产方案。该模型在SWE-bench-Verified基准测试中取得73.8%的成绩,LiveCodeBench-V6测试达84.9%,整体性能与Claude Sonnet 4.5持平。在复杂推理任务方面,其HLE(人类水平考试)成绩在工具辅助条件下提升至42.8%,较前代模型提升超过12个百分点,甚至超越GPT-5.1 High版本。

技术团队重点强化的工具调用能力在τ²-Bench测试中取得87.4%的优异成绩,BrowseComp在开启上下文管理后达到67.5%。这些突破得益于模型架构的重大革新——在原有交错思考机制基础上,新增保留式思考与轮级控制模块。系统现在能够自动保存多轮任务中的推理结果,开发者还可根据任务复杂度选择是否启用完整推理流程,这种设计显著提升了长任务执行的稳定性与一致性。

实际开发场景测试进一步验证了模型实力。在覆盖前端开发、后端逻辑和指令遵循的100个真实任务中,GLM-4.7展现全面进步:前端任务胜率提升至64.6%,指令遵循场景达58.3%,后端复杂任务胜率稳定在46.7%。更值得关注的是,模型在Z.ai平台上线了全栈技能环境,通过全新Skills模块实现ASR语音识别、TTS语音合成和GLM-4.6V视觉模型的统一调度,构建起完整的多模态开发闭环。

通过Z.ai平台的实测案例可见端倪:在3D圣诞树演示中,模型生成的HTML代码不仅构建出由5000多个粒子组成的立体场景,还集成了手势识别功能。用户张开手掌时,粒子组成的圣诞树会炸开形成旋转照片墙,握拳则恢复原状,整个过程伴随流畅的动画效果和物理反馈。另一个iOS界面复刻案例中,生成的页面包含可点击的Safari、健康等应用图标,计算器功能支持基础运算,日历页面可正常切换日期。

技术突破的背后是持续优化的开发生态。GLM系列开源代码在全球社区的下载量已突破6000万次,付费API使用量长期位居OpenRouter全球前十。随着智谱即将登陆港交所,这款模型的推出恰逢其时地展现了国产大模型从技术验证向商业落地的关键跨越。从专业评测到真实场景,从代码生成到多模态调度,GLM-4.7的进化轨迹折射出中国AI企业正在重塑全球开源生态格局。

潘建伟委员:量子通信领先,量子计算跻身国际一流方阵
今天(3月4日)下午,全国政协十四届四次会议首场“委员通道”在人民大会堂举行,全国政协委员、九三学社中央副主席、中国科学院院士潘建伟接受了记者采访。 潘建伟介绍,“十四五”期间,我们大力推进量子科技事业的…

2026-03-05

千元机市场“卷”出新高度:红米强势领跑,一加等品牌紧追不舍
但有意思的是,第二名却被一加抢走,这也让榜单变得更有看点。在红米疯狂卷配置的情况下,一加能拿到第二名,说明它的产品策略确实成功。 如果你追求极致性价比,红米Turbo4确实很难绕开;如果更看重均衡体验,一加A…

2026-03-05

华为赵东:AI智能体时代浪潮下,无线产业需加速创新谋发展
“我们需要保障上行速率能够满足智能体应用的需求,比方说如果用户需要上传图像、视频,那现在单张图像其实就会超过400kb,因为智能体也需要精准地识别到这个照片或视频,它需要视频和图像是高精度的,所以单张图像就…

2026-03-05

阿里Qwen掌舵人林俊旸卸任,32岁最年轻P10的AI传奇暂落帷幕
昨天,他还在安利Qwen 3.5最新的一批小模型,覆盖了0.8B、2B、4B、9B四种参数。此后的6年,是他在阿里狂飙突进的6年: 他亲自挂帅,在内部组建了一支「机器人与具身智能」团队,致力于让大模型「长出…

2026-03-05

华为李鹏:智能体互联网时代将至,5G-A与AI融合开启十万亿新商机
他表示,未来十年,网络价值将从“人与人沟通”全面升级为“智能体互联”,推动运营商从“数据管道”向“价值服务平台”跃迁,同时孕育出 10万亿美元(IT之家注:现汇率约合 69.03 万亿元人民币)级的新产业…

2026-03-05

华为领跑全球6G专利赛道 6G标准化启动 5G-A加速AI融合落地
在6G正式到来之前,5G-A(5.5G)已经成为支撑AI应用大规模落地的必然选择。目前全球行业中已有超过3000万个AI智能体在协同工作,这带来了巨大的网络压力。 之前资料显示,目前全球已有约2万项与6G核心…

2026-03-05