当前位置：首页 » AI最新动态

GLM-5.2 开源模型发布：百万 Token 上下文，Agent 编程能力登顶开放权重模型

1小时前 AI最新动态 11 0

最近 AI 圈炸了一颗重磅炸弹，智谱 AI 正式开源了旗舰模型 GLM 5.2。

我关注开源大模型有一段时间了，这次 GLM 5.2 的方向让我比较意外。它没有走「单纯卷聊天能力」的老路，而是把重点放在了 Agent（智能体）和长周期任务处理上。这个方向恰恰是目前 AI 落地最难啃的骨头。

更有意思的是，GLM 5.2 用的是 MIT 开源许可证，个人和企业都能自由使用、修改、商业部署，没有地域限制。这点对国内做 AI 应用的团队来说是个实打实的利好。

那 GLM 5.2 到底强在哪？我帮你把重点提炼出来了。

四个有分量的升级

一、首次实现稳定的百万 Token 上下文

现在不少大模型都在吹超长上下文，但真正能在超长文本下保持稳定性能的确实不多。GLM 5.2 这次实现的是稳定的 100 万 Token 上下文窗口。这意味着你能同时喂给它一个超大型代码库，或者好几个文档知识库，让它连续执行复杂任务而不会中途断片。

这对未来的 AI Agent 特别关键。真正的 Agent 不是答完一个问题就结束，而是能持续工作几小时甚至几天。没有稳定的长上下文，这事根本做不成。

二、Agent 能力来了个大突破

如果说过去 AI 的竞争核心是聊天能力，那未来一定是执行能力。

根据社区公布的数据，GLM 5.2 成了首个在 Terminal-Bench 测试里突破 80% 成绩的开放权重模型。Terminal-Bench 考察的是模型在真实终端环境里完成复杂任务的能力，覆盖编程、调试、文件处理、命令执行、多步骤任务规划这些场景。以前这个地盘长期被闭源模型占着，现在开源模型终于追上来了。

三、LiveBench 排名进全球第一梯队

在 LiveBench 最新的 Agent Coding 排行榜里，GLM 5.2 和 Kimi K2.7 Code 是当前表现最强的 Agent 编程模型之一。

更让人意外的是，前三名里有两个是开放权重模型。这说明开源生态已经能跟顶级闭源模型正面掰手腕了。对开发者和本地部署玩家来说，这是个非常积极的信号。

四、编程能力做了针对性强化

GLM 5.2 在代码生成上花了不少功夫。官方说它支持不同等级的推理模式，可以根据任务复杂度自由调整思考深度，在性能和响应速度之间找平衡。简单讲就是简单任务快速响应，复杂任务深度思考。

底层架构的升级

IndexShare 架构。官方提出了一套全新的 IndexShare 技术，让每四层稀疏注意力层共享同一个索引器。实测下来，1M 上下文环境下 FLOPs 降了大概 2.9 倍，长上下文效率大幅提升，推理成本也跟着降下来了。

改进的 MTP 推测解码。GLM 5.2 同时优化了 MTP（Multi-Token Prediction）层，官方数据显示推测性解码接受长度最高提升 20%。说白了就是生成速度更快，延迟更低。

如何本地部署

这里有个很容易踩坑的地方。答案是理论上能，现实中基本跑不起来。

GLM 5.2 采用 MoE（混合专家）架构，总参数规模约 753B。社区整理的硬件需求如下：

量化水平	所需内存	最低硬件配置
FP8	744 GB 至 890 GB	8 个 H200 (141GB) 或 8 个 H100 (80GB)
4 位 (Q4_K_M)	476 GB 至 500 GB	Mac Studio 集群或 6 块 80GB 企业级 GPU
2 位 (Q2_K_XL)	241 GB 至 280 GB	单台 256GB Mac Studio（Ultra）或 RTX 4090 + 256GB 内存
1 位动态	176 GB 至 180 GB	192GB Mac Studio 或 24GB GPU + 192GB 系统内存

即使是最低的量化版本，也远远超出普通消费级电脑能扛的范围。对绝大多数人来说，目前更适合通过在线平台体验 GLM 5.2。

支持哪些部署框架？

GLM 5.2 已经支持好几个主流推理框架了，包括 SGLang、vLLM、Transformers、KTransformers，同时还支持 Ascend NPU 生态。整体兼容性不错。

没有企业级显卡，也能免费体验

官方体验地址：https://chat.z.ai/

Hugging Face 在线体验：https://huggingface.co/chat/models/zai-org/GLM-5.2

模型下载

官方满血版：https://huggingface.co/zai-org/GLM-5.2/tree/main

量化版：https://huggingface.co/unsloth/GLM-5.2-GGUF/tree/main

实测结果

为了验证 GLM 5.2 的真实能力，跑了多组高难度代码生成测试，包括 Minecraft 高还原游戏生成、专业射箭网站首页开发、清明上河图 3D 场景构建、花莲机场 3D 场景模拟、南京博物院 3D 展示页面、GTA 风格开放城市、浏览器 WebGL 操作系统、FPS 地铁射击游戏、C++ 拉力赛车项目、奢侈手表 3D 官网。

从实测结果看，GLM 5.2 在复杂前端项目和 Agent 编程场景里表现出了很强的竞争力。

GLM 5.2 最大的意义

很多人看到 753B 参数规模，第一反应是「反正我也跑不起来」。但 GLM 5.2 的真正价值不在让每个人都自己部署，而在于它会成为未来开源模型的重要知识来源。

每次顶级开源模型发布之后，社区都会去蒸馏、微调、优化。未来几个月，我们大概率会看到 GLM 5.2 70B、32B、8B 这些更适合本地部署的版本冒出来。而这些模型，最终会惠及每一个普通用户。

结论

GLM 5.2 不只是一次常规升级，它代表着开源 AI 在 Agent 和编程领域的一次重要突破。

百万 Token 长上下文、Terminal-Bench 首个突破 80%、顶级 Agent 编程能力、MIT 开源协议，这四样加起来，让它成了目前最值得关注的开源模型之一。

开源模型跟闭源模型之间的差距，正在以惊人的速度缩小。这种级别的开源模型越来越多，对用 AI 做事的人来说，是实打实的好消息。

声明：本站原创文章文字版权归本站所有，转载务必注明作者和出处；本站转载文章仅仅代表原作者观点，不代表本站立场，图文版权归原作者所有。如有侵权，请联系我们删除。

未经允许不得转载：GLM-5.2 开源模型发布：百万 Token 上下文，Agent 编程能力登顶开放权重模型

请登录后发表评论