智谱 AI 近日正式开源 GLM-5.2,同步发布技术博客。该模型基于 744B MoE 架构(40B 激活),支持 1M 上下文,采用 MIT 协议开源。API 已全量上线,价格与 5.1 保持一致。
在 Coding 领域,GLM-5.2 在 Arena 榜单上以 1595 分拿下第二,成为该榜单上最强的开源可用模型。


长程任务能力(Long Horizon Task)
GLM-5.2 专为长程任务设计,在三个基准评测(跑在 1M 上下文、Max 档位)中均排名开源第一:
- FrontierSWE(20 小时级复杂工程):GLM-5.2 得分 74.4%,仅次于 Opus 4.8(75.1%),领先于 GPT-5.5(72.6%)。
- PostTrainBench(Agent 10 小时内做 post-training):GLM-5.2 得分 34.3%,优于 GPT-5.5(25.0%)。
- SWE-Marathon(超长周期工程):GLM-5.2 得分 13.0%,表现接近 Opus 4.7。

Coding 与 Agent 评测
在 8 项 Coding + Agentic 评测中,GLM-5.2 保持开源 SOTA:
- Terminal-Bench 2.1:81.0 分(接近 Opus 4.8 的 85.0)。
- HLE with Tools:54.7 分,超越 Opus 4.8(52.3)和 GPT-5.5(52.2)。
- Agentic Coding:在 Claude Code 上跑测试,High 档位与 Opus 4.8 基本重合,Max 档位约 75%。


1M 上下文架构优化
GLM-5.2 在架构上进行了系统性优化,使 1M 上下文在工程中真正可用:
- IndexShare for DSA:每 4 层 Transformer 共享一个轻量 indexer,复用 top-k 索引,节省 3/4 的 indexer 计算量。
- 极致 Infra 优化:Day 0 即可运行在国产算力平台上。



总结
GLM-5.2 的发布标志着国产开源模型在长程任务和 Coding 领域的新高度。其 1M 上下文能力和 MIT 开源协议,为开发者和企业提供了强大的底层支持。
苏米注:GLM-5.2 在 HLE with Tools 上的表现令人惊喜,说明其在复杂工具调用和 Agentic 任务上的潜力巨大。对于需要处理超长上下文代码库的开发者来说,这是一个值得尝试的强力模型。
声明:本站原创文章文字版权归本站所有,转载务必注明作者和出处;本站转载文章仅仅代表原作者观点,不代表本站立场,图文版权归原作者所有。如有侵权,请联系我们删除。