10+年产品经理聊聊产品、测测产品,产品人交流学习成长平台,按 Ctrl+D 收藏我们
关于我 留言板 小程序 标签云

苏米客

  • 首页
  • AIGC
    • AI最新动态
    • AI学习教程
    • AI工具集合
    • AI产品百科
    • AI编程开发
    • AI提示词
    • AI开源项目
    • AI智能体
  • Axure
    • Axure动态
    • Axure教程
  • 产品
    • 用户体验
    • 产品设计
    • 苏米杂谈
  • 资源
    • 产品UI组件库
    • 开源图标库
    • 中后台框架
  • 书单
    • AI书籍
    • 用户体验
    • UI视觉
    • 产品研究
    • 其他类型
  • 下载
    • Axure组件
    • Axure原型
    • 文档报告
    • 素材资源
  • 登录
  • 首页
  • AIGC
    • AI最新动态
    • AI学习教程
    • AI工具集合
    • AI产品百科
    • AI编程开发
    • AI提示词
    • AI开源项目
    • AI智能体
  • Axure
    • Axure动态
    • Axure教程
  • 产品
    • 用户体验
    • 产品设计
    • 苏米杂谈
  • 资源
    • 产品UI组件库
    • 开源图标库
    • 中后台框架
  • 书单
    • AI书籍
    • 用户体验
    • UI视觉
    • 产品研究
    • 其他类型
  • 下载
    • Axure组件
    • Axure原型
    • 文档报告
    • 素材资源
当前位置: 首页 » AI最新动态

GLM-5.2 开源模型发布:百万 Token 上下文,Agent 编程能力登顶开放权重模型

1小时前 AI最新动态 11 0

最近 AI 圈炸了一颗重磅炸弹,智谱 AI 正式开源了旗舰模型 GLM 5.2。

我关注开源大模型有一段时间了,这次 GLM 5.2 的方向让我比较意外。它没有走「单纯卷聊天能力」的老路,而是把重点放在了 Agent(智能体)和长周期任务处理上。这个方向恰恰是目前 AI 落地最难啃的骨头。

图片 1

更有意思的是,GLM 5.2 用的是 MIT 开源许可证,个人和企业都能自由使用、修改、商业部署,没有地域限制。这点对国内做 AI 应用的团队来说是个实打实的利好。

图片 2

那 GLM 5.2 到底强在哪?我帮你把重点提炼出来了。

四个有分量的升级

一、首次实现稳定的百万 Token 上下文

现在不少大模型都在吹超长上下文,但真正能在超长文本下保持稳定性能的确实不多。GLM 5.2 这次实现的是稳定的 100 万 Token 上下文窗口。这意味着你能同时喂给它一个超大型代码库,或者好几个文档知识库,让它连续执行复杂任务而不会中途断片。

这对未来的 AI Agent 特别关键。真正的 Agent 不是答完一个问题就结束,而是能持续工作几小时甚至几天。没有稳定的长上下文,这事根本做不成。

二、Agent 能力来了个大突破

如果说过去 AI 的竞争核心是聊天能力,那未来一定是执行能力。

根据社区公布的数据,GLM 5.2 成了首个在 Terminal-Bench 测试里突破 80% 成绩的开放权重模型。Terminal-Bench 考察的是模型在真实终端环境里完成复杂任务的能力,覆盖编程、调试、文件处理、命令执行、多步骤任务规划这些场景。以前这个地盘长期被闭源模型占着,现在开源模型终于追上来了。

图片 3

三、LiveBench 排名进全球第一梯队

在 LiveBench 最新的 Agent Coding 排行榜里,GLM 5.2 和 Kimi K2.7 Code 是当前表现最强的 Agent 编程模型之一。

更让人意外的是,前三名里有两个是开放权重模型。这说明开源生态已经能跟顶级闭源模型正面掰手腕了。对开发者和本地部署玩家来说,这是个非常积极的信号。

图片 4

四、编程能力做了针对性强化

GLM 5.2 在代码生成上花了不少功夫。官方说它支持不同等级的推理模式,可以根据任务复杂度自由调整思考深度,在性能和响应速度之间找平衡。简单讲就是简单任务快速响应,复杂任务深度思考。

图片 5

底层架构的升级

IndexShare 架构。官方提出了一套全新的 IndexShare 技术,让每四层稀疏注意力层共享同一个索引器。实测下来,1M 上下文环境下 FLOPs 降了大概 2.9 倍,长上下文效率大幅提升,推理成本也跟着降下来了。

改进的 MTP 推测解码。GLM 5.2 同时优化了 MTP(Multi-Token Prediction)层,官方数据显示推测性解码接受长度最高提升 20%。说白了就是生成速度更快,延迟更低。

如何本地部署

这里有个很容易踩坑的地方。答案是理论上能,现实中基本跑不起来。

GLM 5.2 采用 MoE(混合专家)架构,总参数规模约 753B。社区整理的硬件需求如下:

量化水平 所需内存 最低硬件配置
FP8 744 GB 至 890 GB 8 个 H200 (141GB) 或 8 个 H100 (80GB)
4 位 (Q4_K_M) 476 GB 至 500 GB Mac Studio 集群或 6 块 80GB 企业级 GPU
2 位 (Q2_K_XL) 241 GB 至 280 GB 单台 256GB Mac Studio(Ultra)或 RTX 4090 + 256GB 内存
1 位动态 176 GB 至 180 GB 192GB Mac Studio 或 24GB GPU + 192GB 系统内存

即使是最低的量化版本,也远远超出普通消费级电脑能扛的范围。对绝大多数人来说,目前更适合通过在线平台体验 GLM 5.2。

图片 6

支持哪些部署框架?

GLM 5.2 已经支持好几个主流推理框架了,包括 SGLang、vLLM、Transformers、KTransformers,同时还支持 Ascend NPU 生态。整体兼容性不错。

没有企业级显卡,也能免费体验

官方体验地址:https://chat.z.ai/

Hugging Face 在线体验:https://huggingface.co/chat/models/zai-org/GLM-5.2

模型下载

官方满血版:https://huggingface.co/zai-org/GLM-5.2/tree/main

量化版:https://huggingface.co/unsloth/GLM-5.2-GGUF/tree/main

图片 7

实测结果

为了验证 GLM 5.2 的真实能力,跑了多组高难度代码生成测试,包括 Minecraft 高还原游戏生成、专业射箭网站首页开发、清明上河图 3D 场景构建、花莲机场 3D 场景模拟、南京博物院 3D 展示页面、GTA 风格开放城市、浏览器 WebGL 操作系统、FPS 地铁射击游戏、C++ 拉力赛车项目、奢侈手表 3D 官网。

从实测结果看,GLM 5.2 在复杂前端项目和 Agent 编程场景里表现出了很强的竞争力。

图片 8

GLM 5.2 最大的意义

很多人看到 753B 参数规模,第一反应是「反正我也跑不起来」。但 GLM 5.2 的真正价值不在让每个人都自己部署,而在于它会成为未来开源模型的重要知识来源。

每次顶级开源模型发布之后,社区都会去蒸馏、微调、优化。未来几个月,我们大概率会看到 GLM 5.2 70B、32B、8B 这些更适合本地部署的版本冒出来。而这些模型,最终会惠及每一个普通用户。

结论

GLM 5.2 不只是一次常规升级,它代表着开源 AI 在 Agent 和编程领域的一次重要突破。

百万 Token 长上下文、Terminal-Bench 首个突破 80%、顶级 Agent 编程能力、MIT 开源协议,这四样加起来,让它成了目前最值得关注的开源模型之一。

开源模型跟闭源模型之间的差距,正在以惊人的速度缩小。这种级别的开源模型越来越多,对用 AI 做事的人来说,是实打实的好消息。

声明:本站原创文章文字版权归本站所有,转载务必注明作者和出处;本站转载文章仅仅代表原作者观点,不代表本站立场,图文版权归原作者所有。如有侵权,请联系我们删除。
未经允许不得转载:GLM-5.2 开源模型发布:百万 Token 上下文,Agent 编程能力登顶开放权重模型
#GLM-5.2 #开源模型 #智谱AI #Agent编程 #大模型 
收藏 1
20个值得收藏的Agent Skills合集:从安装到自己造,SKILL.md正成为Agent时代的npm
Vercel 开源 Agent 框架 eve:约定优于配置的 Agent 开发新范式
推荐阅读
  • Gemini 3 悄悄上线,美观和信息丰富的设计
  • ChatGPT Go版上线+广告引入:免费、低价付费用户,优先体验
  • DeepSeek-V3.1正式发布,并同步开源!
  • Qoder定价更新:Pro版20刀/月,到底值不值得入?
  • Mac Mini M4 部署 Qwen3.5 最佳方案:MLX、Ollama、DFlash 全面对比评测
评论 (0)
请登录后发表评论
分类精选
Cursor 限制国内使用 Claude 等模型解决方案!
31210 11月前
学生/非学生:如何申请Cursor Pro免费会员,如何通过SheerID验证快速激活全攻略
28395 1年前
即梦AI图片2.1:一句话快速生成带中文的海报图,免费AI文生图、视频工具、AIGC创作工具
20130 1年前
注意!Cursor单设备登录新规:一个账户最多可以3台设备登录,且限制单点登录
19880 1年前
DeepSeek宣布:降价,最高降价75%!别错过这个优惠时段,赶紧充值
16241 1年前
Trae国内版,搭载 doubao-1.5-pro、DeepSeek R1/V3模型,对比 Trae 国际版有什么不同
16229 1年前
字节推出Trae CLI :Claude Code 和 Gemini CLI的国产平替 ?手把手教你如何安装Trae Agent
15784 11月前
刚刚!Cursor风控又加强了,可能是因为这个原因!
15016 1年前
国产大模型横向对比:Kimi K2.6、GLM-5.1、Qwen3、MiniMax M2 四大模型选型指南
14548 2月前
字节跳动发布"扣子空间":AI协同办公的通用Agent平台开启效率革命
14386 1年前

文章目录

关注「苏米客」公众号

订阅推送更及时,手机查看更方便
分类排行
1 Anthropic 推出 Claude Tag:让 AI 以团队成员身份加入 Slack 协作
2 Vercel 开源 Agent 框架 eve:约定优于配置的 Agent 开发新范式
3 GLM-5.2 开源模型发布:百万 Token 上下文,Agent 编程能力登顶开放权重模型
4 Transformer 发明人与诺奖得主相继出走:谷歌 AI 的人才流失危机
5 WorkBuddy AI 专属卡实测:不是帮你花钱,是帮你省时间
6 方舟 Coding Plan 升级 GLM-5.2:支持 Claude Code 等主流编程工具直接调用
7 微信大语言模型 WeLM 揭秘:专为微信生态设计的低成本 MoE 架构,128K 长上下文
8 Nex-N2-Pro 开源模型,性能对标 GPT-5.5,专为 Agent 场景设计,限时免费
9 纳德拉:未来开发者要管理 1000 个 AI Agent,编程不会死但工作方式会变
10 微信小微 AI Agent :自研 WeLM 模型、语音优先交互、个人小工具生态
©2015-2024 苏米客XMSUMI 版权所有 · WWW.XMSUMI.COM 闽ICP备14005900号-6
微信文章助手 程序库 免费影视APP 免费字体下载 Axure RP 10 免费Axure模板 Axure元件库下载 申请友联