当前位置：首页 » AI最新动态

OpenCode 发布大模型调用数据报告：DeepSeek 用量第一，Qwen 缓存命中率 98%

1月前 AI最新动态 899 0

OpenCode 近日正式发布 OpenCode Data Report，开发者现可通过官方页面实时获取大模型调用数据。报告涵盖了 2026 年 4 月 18 日至 6 月 12 日期间的编码代理领域数据，揭示了当前 AI 编码市场的"性能 - 成本"博弈格局。

数据显示，DeepSeek V4 系列凭借极低的推理成本和高缓存命中率占据主导地位，而 Kimi (Moonshot) 和 GLM-5.1 也快速崛起。本文将基于 OpenCode 官方数据，对各大模型的表现、成本及市场趋势进行深度解析。

1. Top Models：模型排名

按令牌使用量（Token Usage）排序，OpenCode 平台上前几名的模型分别是：

DeepSeek-v4-Flash：31T（占比最高）
DeepSeek-v4-Pro：18T
Kimi-K2.6：6.4T
GLM-5.1：2.4T
Qwen3.6-Plus：2.3T

DeepSeek V4 系列优势明显，累计约 49T 的使用量。单次会话平均使用的令牌数方面，DeepSeek-Flash 表现突出（约 6.6M tokens）。新发布模型如 Kimi 和 DeepSeek 用户增长迅速，而部分老模型同比增速显著。

2. Session Cost：会话成本分析

会话成本即一次编码交互的平均花费。OpenCode 数据显示，各模型的平均每会话成本差异巨大：

模型	会话成本 ($)	估算令牌/会话
mimo-v2.5	$0.0579	~5.8M
deepseek-v4-flash	$0.0662	~6.6M
mimo-v2.5-pro	$0.4775	~4.8M
deepseek-v4-pro	$0.5501	~6.9M
qwen3.7-plus	$0.6371	~7.0M
minimax-m3	$0.7293	~7.3M
qwen3.6-plus	$0.7597	~7.6M
kimi-k2.6	$0.9663	~3.6M
glm-5.1	$1.1666	~1.4M
qwen3.7-max	$1.5882	~1.9M

计算公式：每会话成本 ≈ 输入令牌数×输入价格 + 输出令牌数×输出价格 - 缓存节省。OpenCode 提示基础定价为输入 $1.74/1M、输出 $2.52/1M、缓存令牌 $0.05/1M。在高缓存率条件下，多数输入令牌按 $0.05 而非 $1.74 计费，大幅降低成本。

3. Token Cost：每百万令牌价格

各模型的令牌定价差异明显，决定了规模化使用成本。部分模型的每 1M tokens 价格（美元）如下：

DeepSeek-v4-Flash：$0.01
MiMo-v2.5：$0.01
DeepSeek-v4-Pro：$0.08
MiniMax-m3：$0.09
MiMo-v2.5-Pro：$0.10
Qwen3.7-Plus：$0.18
Kimi-K2.6：$0.24
Qwen3.6-Plus：$0.26
GLM-5.1：$0.41
Qwen3.7-Max：$0.84

DeepSeek V4 系列和 MiMo-v2.5 拥有极低的定价（$0.01），而 Qwen3.7-Max 高达 $0.84，价格差距高达 80 倍以上。

4. Cache Ratio：缓存命中率

输入令牌缓存命中率是降低成本的关键。数据表明：

Qwen3.7-Max：98%（榜首）
DeepSeek-v4-Pro：97%
DeepSeek-v4-Flash：97%
MiMo-v2.5-Pro：96%
MiMo-v2.5：95%
Qwen3.7-Plus：95%
MiniMax-m3：94%
Kimi-K2.6：94%
GLM-5.1：89%
Qwen3.6-Plus：88%

整体输入缓存命中率约为 97%，累计缓存令牌 7.0T。命中率最高的是 Qwen3.7-Max 和 DeepSeek 系列。高命中率意味着实际使用成本远低于名义价格。

5. Market Share：模型作者市场份额

按模型作者汇总的令牌市场份额排名前五：

排名	作者/品牌	份额
1	Zhipu (GLM)	28.2%
2	MiniMax	23.0%
3	Qwen (阿里)	22.3%
4	Moonshot (Kimi)	21.1%
5	Xiaomi	5.5%

Zhipu 的 GLM 系列占据最多令牌市场（28%），其次是 MiniMax (23%)、阿里 Qwen (22%)、Moonshot Kimi (21%)。尽管 DeepSeek 在单模型上用量巨大，但其作者不在前五榜单中，说明尚未形成庞大的"作者"品牌效应。

6. Geo Breakdown：地理分布

OpenCode 官方列出了各国令牌使用量前 15 名：

中国：28T (15%)
美国：20T (11%)
印度：11T (6%)
巴西：8.2T (4%)
德国：7.8T (4%)

中国用户使用量最高（占 15%），美国次之（11%）。亚洲地区（中国、印度、日本、印尼、香港、新加坡）和北美占比靠前。

7. 深度分析：为什么是 DeepSeek 和 Qwen？

DeepSeek 系列优势原因

DeepSeek V4-Flash/Pro 在各项指标上表现卓越。其关键优势在于：

成本极低：Flash 版价格低至 $0.01/1M。
长上下文：提供 1M token 长上下文，有效支持大型会话。
集成优化：与 OpenCode 等主流编码代理深度集成。
高缓存命中：97% 的命中率意味着大部分请求可以从缓存快速响应。

Qwen3.7-Max 高缓存命中率原因

Qwen3.7-Max 缓存命中率高达 98%，可能原因包括：在 OpenCode 内多作为默认模型使用，用户请求具有高度相似性和可重用性；Qwen 系列强调一致性和稳定性，答复标准化，有利于缓存匹配。

Kimi 与 GLM 市场份额对比

Zhipu (GLM) 的市场份额（28.2%）略高于 Moonshot (Kimi)（21.1%）。GLM-5.1 作为大型通用模型，用户基础更广；Kimi 系列虽为新模型，但增长显著。GLM 目前领先，但 Kimi 增速也快。

8. 策略建议

基于 OpenCode 数据，对从业者的建议：

关注低成本高效模型：优先采用 DeepSeek-V4 等低推理费率模型。
利用缓存策略：尽可能复用相同上下文输入，或加强模型侧的上下文缓存。
关注区域偏好：中国用户倾向于 GLM/Kimi，英语市场可能青睐 Qwen/DeepSeek。
跟踪市场动态：模型排名变化迅速，建议定期基准测试新模型。
重视模型差异化：结合具体用例需求选择模型，不应单纯以价格为唯一判断。

总体而言，缓存技术与成本控制是当前开源编码代理市场竞争的核心。

声明：本站原创文章文字版权归本站所有，转载务必注明作者和出处；本站转载文章仅仅代表原作者观点，不代表本站立场，图文版权归原作者所有。如有侵权，请联系我们删除。

未经允许不得转载：OpenCode 发布大模型调用数据报告：DeepSeek 用量第一，Qwen 缓存命中率 98%

请登录后发表评论