10+年产品经理聊聊产品、测测产品,产品人交流学习成长平台,按 Ctrl+D 收藏我们
关于我 留言板 小程序 标签云

苏米客

  • 首页
  • AIGC
    • AI最新动态
    • AI学习教程
    • AI工具集合
    • AI产品百科
    • AI编程开发
    • AI提示词
    • AI开源项目
    • AI智能体
  • Axure
    • Axure动态
    • Axure教程
  • 产品
    • 用户体验
    • 产品设计
    • 苏米杂谈
  • 资源
    • 产品UI组件库
    • 开源图标库
    • 中后台框架
  • 书单
    • AI书籍
    • 用户体验
    • UI视觉
    • 产品研究
    • 其他类型
  • 下载
    • Axure组件
    • Axure原型
    • 文档报告
    • 素材资源
  • 登录
  • 首页
  • AIGC
    • AI最新动态
    • AI学习教程
    • AI工具集合
    • AI产品百科
    • AI编程开发
    • AI提示词
    • AI开源项目
    • AI智能体
  • Axure
    • Axure动态
    • Axure教程
  • 产品
    • 用户体验
    • 产品设计
    • 苏米杂谈
  • 资源
    • 产品UI组件库
    • 开源图标库
    • 中后台框架
  • 书单
    • AI书籍
    • 用户体验
    • UI视觉
    • 产品研究
    • 其他类型
  • 下载
    • Axure组件
    • Axure原型
    • 文档报告
    • 素材资源
当前位置: 首页 » AI最新动态

OpenCode 发布大模型调用数据报告:DeepSeek 用量第一,Qwen 缓存命中率 98%

1小时前 AI最新动态 8 0

OpenCode 近日正式发布 OpenCode Data Report,开发者现可通过官方页面实时获取大模型调用数据。报告涵盖了 2026 年 4 月 18 日至 6 月 12 日期间的编码代理领域数据,揭示了当前 AI 编码市场的"性能 - 成本"博弈格局。

数据显示,DeepSeek V4 系列凭借极低的推理成本和高缓存命中率占据主导地位,而 Kimi (Moonshot) 和 GLM-5.1 也快速崛起。本文将基于 OpenCode 官方数据,对各大模型的表现、成本及市场趋势进行深度解析。

OpenCode Data 执行摘要

1. Top Models:模型排名

按令牌使用量(Token Usage)排序,OpenCode 平台上前几名的模型分别是:

  • DeepSeek-v4-Flash:31T(占比最高)
  • DeepSeek-v4-Pro:18T
  • Kimi-K2.6:6.4T
  • GLM-5.1:2.4T
  • Qwen3.6-Plus:2.3T

DeepSeek V4 系列优势明显,累计约 49T 的使用量。单次会话平均使用的令牌数方面,DeepSeek-Flash 表现突出(约 6.6M tokens)。新发布模型如 Kimi 和 DeepSeek 用户增长迅速,而部分老模型同比增速显著。

2. Session Cost:会话成本分析

会话成本即一次编码交互的平均花费。OpenCode 数据显示,各模型的平均每会话成本差异巨大:

模型 会话成本 ($) 估算令牌/会话
mimo-v2.5 $0.0579 ~5.8M
deepseek-v4-flash $0.0662 ~6.6M
mimo-v2.5-pro $0.4775 ~4.8M
deepseek-v4-pro $0.5501 ~6.9M
qwen3.7-plus $0.6371 ~7.0M
minimax-m3 $0.7293 ~7.3M
qwen3.6-plus $0.7597 ~7.6M
kimi-k2.6 $0.9663 ~3.6M
glm-5.1 $1.1666 ~1.4M
qwen3.7-max $1.5882 ~1.9M

计算公式:每会话成本 ≈ 输入令牌数×输入价格 + 输出令牌数×输出价格 - 缓存节省。OpenCode 提示基础定价为输入 $1.74/1M、输出 $2.52/1M、缓存令牌 $0.05/1M。在高缓存率条件下,多数输入令牌按 $0.05 而非 $1.74 计费,大幅降低成本。

模型会话成本对比

3. Token Cost:每百万令牌价格

各模型的令牌定价差异明显,决定了规模化使用成本。部分模型的每 1M tokens 价格(美元)如下:

  • DeepSeek-v4-Flash:$0.01
  • MiMo-v2.5:$0.01
  • DeepSeek-v4-Pro:$0.08
  • MiniMax-m3:$0.09
  • MiMo-v2.5-Pro:$0.10
  • Qwen3.7-Plus:$0.18
  • Kimi-K2.6:$0.24
  • Qwen3.6-Plus:$0.26
  • GLM-5.1:$0.41
  • Qwen3.7-Max:$0.84

DeepSeek V4 系列和 MiMo-v2.5 拥有极低的定价($0.01),而 Qwen3.7-Max 高达 $0.84,价格差距高达 80 倍以上。

模型定价对比

4. Cache Ratio:缓存命中率

输入令牌缓存命中率是降低成本的关键。数据表明:

  • Qwen3.7-Max:98%(榜首)
  • DeepSeek-v4-Pro:97%
  • DeepSeek-v4-Flash:97%
  • MiMo-v2.5-Pro:96%
  • MiMo-v2.5:95%
  • Qwen3.7-Plus:95%
  • MiniMax-m3:94%
  • Kimi-K2.6:94%
  • GLM-5.1:89%
  • Qwen3.6-Plus:88%

整体输入缓存命中率约为 97%,累计缓存令牌 7.0T。命中率最高的是 Qwen3.7-Max 和 DeepSeek 系列。高命中率意味着实际使用成本远低于名义价格。

模型缓存命中率

5. Market Share:模型作者市场份额

按模型作者汇总的令牌市场份额排名前五:

排名 作者/品牌 份额
1 Zhipu (GLM) 28.2%
2 MiniMax 23.0%
3 Qwen (阿里) 22.3%
4 Moonshot (Kimi) 21.1%
5 Xiaomi 5.5%

Zhipu 的 GLM 系列占据最多令牌市场(28%),其次是 MiniMax (23%)、阿里 Qwen (22%)、Moonshot Kimi (21%)。尽管 DeepSeek 在单模型上用量巨大,但其作者不在前五榜单中,说明尚未形成庞大的"作者"品牌效应。

模型作者市场份额

6. Geo Breakdown:地理分布

OpenCode 官方列出了各国令牌使用量前 15 名:

  • 中国:28T (15%)
  • 美国:20T (11%)
  • 印度:11T (6%)
  • 巴西:8.2T (4%)
  • 德国:7.8T (4%)

中国用户使用量最高(占 15%),美国次之(11%)。亚洲地区(中国、印度、日本、印尼、香港、新加坡)和北美占比靠前。

用户地理分布

7. 深度分析:为什么是 DeepSeek 和 Qwen?

DeepSeek 系列优势原因

DeepSeek V4-Flash/Pro 在各项指标上表现卓越。其关键优势在于:

  • 成本极低:Flash 版价格低至 $0.01/1M。
  • 长上下文:提供 1M token 长上下文,有效支持大型会话。
  • 集成优化:与 OpenCode 等主流编码代理深度集成。
  • 高缓存命中:97% 的命中率意味着大部分请求可以从缓存快速响应。

Qwen3.7-Max 高缓存命中率原因

Qwen3.7-Max 缓存命中率高达 98%,可能原因包括:在 OpenCode 内多作为默认模型使用,用户请求具有高度相似性和可重用性;Qwen 系列强调一致性和稳定性,答复标准化,有利于缓存匹配。

Kimi 与 GLM 市场份额对比

Zhipu (GLM) 的市场份额(28.2%)略高于 Moonshot (Kimi)(21.1%)。GLM-5.1 作为大型通用模型,用户基础更广;Kimi 系列虽为新模型,但增长显著。GLM 目前领先,但 Kimi 增速也快。

各国最受欢迎模型

8. 策略建议

基于 OpenCode 数据,对从业者的建议:

  • 关注低成本高效模型:优先采用 DeepSeek-V4 等低推理费率模型。
  • 利用缓存策略:尽可能复用相同上下文输入,或加强模型侧的上下文缓存。
  • 关注区域偏好:中国用户倾向于 GLM/Kimi,英语市场可能青睐 Qwen/DeepSeek。
  • 跟踪市场动态:模型排名变化迅速,建议定期基准测试新模型。
  • 重视模型差异化:结合具体用例需求选择模型,不应单纯以价格为唯一判断。

总体而言,缓存技术与成本控制是当前开源编码代理市场竞争的核心。

声明:本站原创文章文字版权归本站所有,转载务必注明作者和出处;本站转载文章仅仅代表原作者观点,不代表本站立场,图文版权归原作者所有。如有侵权,请联系我们删除。
未经允许不得转载:OpenCode 发布大模型调用数据报告:DeepSeek 用量第一,Qwen 缓存命中率 98%
#OpenCode # DeepSeek # Qwen # AI 数据 # 模型评测 
收藏 1
MiniMax-M3 免费使用指南:TokenRouter 接入教程,限时 5 天
这是最后一篇
推荐阅读
  • GitHub Copilot大整合:一个订阅,统一所有AI编程助手
  • Liquid Glass React:让你的网站也能拥有Liquid Glass液态玻璃UI效果的开源项目
  • 谷歌 Gemini 2.5 系列全线升级:Pro转正、Flash-Lite登场,AI模型卷出新高度
  • LiblibAI 上线 Z-Image Turbo 模型!
  • GPT-5.1来了,这次小迭代GPT-5.1 Instant和GPT-5.1 Thinking该怎么选、怎么用
评论 (0)
请登录后发表评论
分类精选
Cursor 限制国内使用 Claude 等模型解决方案!
30937 11月前
学生/非学生:如何申请Cursor Pro免费会员,如何通过SheerID验证快速激活全攻略
28126 1年前
即梦AI图片2.1:一句话快速生成带中文的海报图,免费AI文生图、视频工具、AIGC创作工具
19678 1年前
注意!Cursor单设备登录新规:一个账户最多可以3台设备登录,且限制单点登录
19500 1年前
DeepSeek宣布:降价,最高降价75%!别错过这个优惠时段,赶紧充值
16116 1年前
Trae国内版,搭载 doubao-1.5-pro、DeepSeek R1/V3模型,对比 Trae 国际版有什么不同
15971 1年前
字节推出Trae CLI :Claude Code 和 Gemini CLI的国产平替 ?手把手教你如何安装Trae Agent
15552 11月前
刚刚!Cursor风控又加强了,可能是因为这个原因!
14855 1年前
字节跳动发布"扣子空间":AI协同办公的通用Agent平台开启效率革命
14260 1年前
国产大模型横向对比:Kimi K2.6、GLM-5.1、Qwen3、MiniMax M2 四大模型选型指南
13499 1月前

文章目录

关注「苏米客」公众号

订阅推送更及时,手机查看更方便
分类排行
1 OpenCode 发布大模型调用数据报告:DeepSeek 用量第一,Qwen 缓存命中率 98%
2 GLM-5.2 发布:1M 上下文 + 全量开放,国产 Coding 模型新标杆
3 Claude Fable 5 全球下线始末,当安全叙事成为监管利器
4 Claude Fable 5 vs GPT-5.5 实测对比,2026 年编程 AI 选型指南
5 小米开源 MiMoCode,5 人 14 天打造的 AI 编程 Agent,支持跨会话记忆与多 Agent 协作
6 Google Gemini 3.5 Live Translate:70+语言实时同声翻译模型发布
7 火山方舟Coding Plan 和 Agent Plan 系列套餐 618特惠9.9元起,旗舰模型19元购
8 微信AI生态正式内测:小程序自动化操作时代来了
9 Qwen3.7-Plus正式上线:阿里最强多模态智能体模型,限时8折
10 Anthropic Mythos 神话级模型正式发布:Claude Fable 5 对所有人开放,Claude Mythos 5 继续限制访问
©2015-2024 苏米客XMSUMI 版权所有 · WWW.XMSUMI.COM 闽ICP备14005900号-6
微信文章助手 程序库 免费影视APP 免费字体下载 Axure RP 10 免费Axure模板 Axure元件库下载 申请友联