10+年产品经理聊聊产品、测测产品,产品人交流学习成长平台,按 Ctrl+D 收藏我们
关于我 留言板 小程序 标签云

苏米客

  • 首页
  • AIGC
    • AI最新动态
    • AI学习教程
    • AI工具集合
    • AI产品百科
    • AI编程开发
    • AI提示词
    • AI开源项目
    • AI智能体
  • Axure
    • Axure动态
    • Axure教程
  • 产品
    • 用户体验
    • 产品设计
    • 苏米杂谈
  • 资源
    • 产品UI组件库
    • 开源图标库
    • 中后台框架
  • 书单
    • AI书籍
    • 用户体验
    • UI视觉
    • 产品研究
    • 其他类型
  • 下载
    • Axure组件
    • Axure原型
    • 文档报告
    • 素材资源
  • 登录
  • 首页
  • AIGC
    • AI最新动态
    • AI学习教程
    • AI工具集合
    • AI产品百科
    • AI编程开发
    • AI提示词
    • AI开源项目
    • AI智能体
  • Axure
    • Axure动态
    • Axure教程
  • 产品
    • 用户体验
    • 产品设计
    • 苏米杂谈
  • 资源
    • 产品UI组件库
    • 开源图标库
    • 中后台框架
  • 书单
    • AI书籍
    • 用户体验
    • UI视觉
    • 产品研究
    • 其他类型
  • 下载
    • Axure组件
    • Axure原型
    • 文档报告
    • 素材资源
当前位置: 首页 » AI最新动态

GLM 5.2 开源详览:1M 上下文、744B MoE 架构与 Coding 实测

1小时前 AI最新动态 7 0

智谱 AI 近日正式开源 GLM-5.2,同步发布技术博客。该模型基于 744B MoE 架构(40B 激活),支持 1M 上下文,采用 MIT 协议开源。API 已全量上线,价格与 5.1 保持一致。

在 Coding 领域,GLM-5.2 在 Arena 榜单上以 1595 分拿下第二,成为该榜单上最强的开源可用模型。

图片 1

图片 2

长程任务能力(Long Horizon Task)

GLM-5.2 专为长程任务设计,在三个基准评测(跑在 1M 上下文、Max 档位)中均排名开源第一:

  • FrontierSWE(20 小时级复杂工程):GLM-5.2 得分 74.4%,仅次于 Opus 4.8(75.1%),领先于 GPT-5.5(72.6%)。
  • PostTrainBench(Agent 10 小时内做 post-training):GLM-5.2 得分 34.3%,优于 GPT-5.5(25.0%)。
  • SWE-Marathon(超长周期工程):GLM-5.2 得分 13.0%,表现接近 Opus 4.7。

图片 3

Coding 与 Agent 评测

在 8 项 Coding + Agentic 评测中,GLM-5.2 保持开源 SOTA:

  • Terminal-Bench 2.1:81.0 分(接近 Opus 4.8 的 85.0)。
  • HLE with Tools:54.7 分,超越 Opus 4.8(52.3)和 GPT-5.5(52.2)。
  • Agentic Coding:在 Claude Code 上跑测试,High 档位与 Opus 4.8 基本重合,Max 档位约 75%。

图片 4

图片 5

1M 上下文架构优化

GLM-5.2 在架构上进行了系统性优化,使 1M 上下文在工程中真正可用:

  • IndexShare for DSA:每 4 层 Transformer 共享一个轻量 indexer,复用 top-k 索引,节省 3/4 的 indexer 计算量。
  • 极致 Infra 优化:Day 0 即可运行在国产算力平台上。

图片 6

图片 7

图片 8

总结

GLM-5.2 的发布标志着国产开源模型在长程任务和 Coding 领域的新高度。其 1M 上下文能力和 MIT 开源协议,为开发者和企业提供了强大的底层支持。

苏米注:GLM-5.2 在 HLE with Tools 上的表现令人惊喜,说明其在复杂工具调用和 Agentic 任务上的潜力巨大。对于需要处理超长上下文代码库的开发者来说,这是一个值得尝试的强力模型。

声明:本站原创文章文字版权归本站所有,转载务必注明作者和出处;本站转载文章仅仅代表原作者观点,不代表本站立场,图文版权归原作者所有。如有侵权,请联系我们删除。
未经允许不得转载:GLM 5.2 开源详览:1M 上下文、744B MoE 架构与 Coding 实测
#GLM-5.2 #智谱AI #开源模型 #Coding #1M上下文 
收藏 1
Omnigent:Databricks 开源的多 Agent 管理平台,5 天获 3000 Star
这是最后一篇
推荐阅读
  • 支付宝上线「AI收」功能,AI Agent商业化新突破
  • 免费薅羊毛!Qwen3-Coder 每天2000次额度白嫖攻略
  • 阿里云百炼Token Plan 值不值,三个档位该如何选?
  • 完整解读:斯坦福 AI 年度报告 2026|423 页 15 条核心要点
  • Gemma 4 开源实测:31B 参数跻身全球前三,oMLX + Mac Mini 打造高性价比 AI 底座
评论 (0)
请登录后发表评论
分类精选
Cursor 限制国内使用 Claude 等模型解决方案!
31031 11月前
学生/非学生:如何申请Cursor Pro免费会员,如何通过SheerID验证快速激活全攻略
28231 1年前
即梦AI图片2.1:一句话快速生成带中文的海报图,免费AI文生图、视频工具、AIGC创作工具
19831 1年前
注意!Cursor单设备登录新规:一个账户最多可以3台设备登录,且限制单点登录
19620 1年前
DeepSeek宣布:降价,最高降价75%!别错过这个优惠时段,赶紧充值
16166 1年前
Trae国内版,搭载 doubao-1.5-pro、DeepSeek R1/V3模型,对比 Trae 国际版有什么不同
16088 1年前
字节推出Trae CLI :Claude Code 和 Gemini CLI的国产平替 ?手把手教你如何安装Trae Agent
15638 11月前
刚刚!Cursor风控又加强了,可能是因为这个原因!
14918 1年前
字节跳动发布"扣子空间":AI协同办公的通用Agent平台开启效率革命
14310 1年前
国产大模型横向对比:Kimi K2.6、GLM-5.1、Qwen3、MiniMax M2 四大模型选型指南
13971 2月前

文章目录

关注「苏米客」公众号

订阅推送更及时,手机查看更方便
分类排行
1 GLM 5.2 开源详览:1M 上下文、744B MoE 架构与 Coding 实测
2 SpaceX 600 亿美元收购 Cursor:马斯克买下 AI 编程入口
3 GLM-5.2 开源:1M 上下文、744B MoE 与工程化突破
4 Kimi K2.7 Code 高速版实测:4 个工程任务验证,适合进工作流的 coding agent
5 ChatGPT Pro/Plus/Teams 强制重置:最后窗口期利用指南
6 4 个免费 Token 渠道全攻略:两个月没花一分钱
7 ZCode 3.0 + GLM-5.2 深度评测:国产 AI 编程工具的最佳组合
8 Kimi K2.7 Code 模型发布:长程编程 token 消耗降 30%,6 倍速高速版即将上线
9 OpenCode 发布大模型调用数据报告:DeepSeek 用量第一,Qwen 缓存命中率 98%
10 GLM-5.2 发布:1M 上下文 + 全量开放,国产 Coding 模型新标杆
©2015-2024 苏米客XMSUMI 版权所有 · WWW.XMSUMI.COM 闽ICP备14005900号-6
微信文章助手 程序库 免费影视APP 免费字体下载 Axure RP 10 免费Axure模板 Axure元件库下载 申请友联