2026 年 4 月,国内 AI 编程订阅套餐迎来"大撤退"。曾经低至 7.9 元/月的 Coding Plan 正在全面消失,取而代之的是按量计费的 Token Plan。
这场转向背后,是亏损、算力危机,还是商业模式的必然演进?
Coding Plan 的"生死 48 小时"
2026 年 4 月 13 日 18 时,阿里云百炼正式关闭了 Coding Plan Lite 基础套餐的续费通道。
这不是一个孤立事件,而是一场行业级别"大转向"的缩影。
| 时间 | 事件 |
|---|---|
| 2025 年底 | 智谱 AI 率先推出 GLM Coding Plan,开启行业先河 |
| 2026 年 2 月 | 阿里云百炼以"首月 7.9 元"的激进定价入局 |
| 2026 年 2 月 12 日 | 智谱涨价并取消首购优惠,Lite 从¥40 涨至¥49 |
| 2026 年 3 月 20 日 | 阿里云百炼停止 Coding Plan Lite 新购 |
| 2026 年 4 月 13 日 | 阿里云百炼正式关闭 Lite 续费 |
| 2026 年 4 月中旬 | 腾讯云悄然下架 Coding Plan,全面转向 Token Plan |
从"争相入场"到"全面撤退",这场大戏只用了不到半年时间。
七大平台 Coding Plan 现状
🔴 已停售/清退:
- 阿里云百炼:Lite 版已停止新购和续费,Pro 版长期售罄,每日限量补货秒光
- 腾讯云:Coding Plan 活动页面显示"本次活动已结束",全面转向 Token Plan
🟡 收紧/涨价:
- 智谱 GLM:2 月已涨价,Lite 从¥40 涨至¥49,Max 涨至¥469,同时大幅削减免费额度
- 火山方舟:持续收紧额度,限制加剧
🟢 尚在售(但也岌岌可危):
- 百度千帆:仍可售,但价格持续调整中
- Kimi:维持在售,但额度有所收紧
- MiniMax:在售,但市场声量较小
停售背后的三大核心原因
原因一:巨额亏损,"收 1 亏 10"的不可持续模式
Coding Plan 的商业模式存在一个致命缺陷:固定月费 vs 无限使用。
以阿里云百炼 Lite 为例,月费 40 元,用户可以无限调用 AI 模型进行编程。当用户使用 OpenClaw、Cursor 等工具进行高频开发时,实际消耗的算力成本远超订阅费。
据行业内部测算,一个重度用户的月度算力成本可能达到数百元甚至上千元,而厂商只能收到 40 元的订阅费。这就是所谓的"收 1 亏 10"——每收 1 元订阅费,可能要补贴 10 元算力成本。
原因二:OpenClaw 爆火,算力需求激增
2026 年初,OpenClaw 在国内开发者群体中迅速普及,AI 编程从"小众工具"变成了"开发标配"。
大量开发者同时使用 Coding Plan 接入 OpenClaw、Cursor、Cline 等工具,导致厂商算力资源被严重挤兑。阿里云 Pro 版"每日限量补货秒光"的现象,就是算力瓶颈的直接体现。
原因三:粗粒度计费模式终被淘汰
Coding Plan 采用"包月不限次"的粗粒度计费模式,无法区分轻度和重度用户的使用差异。相比之下,Token Plan(按量计费)能够精确计量每次调用,实现成本与收入的匹配。
苏米注:从商业逻辑看,这是从"粗放补贴"走向"精细化运营"的必然选择。任何商业模式如果不能覆盖成本,最终都会走向终结。
转向 Token Plan:开发者的成本账
腾讯云下架 Coding Plan 后,全面推行了全新的 Token Plan。
与 Coding Plan 的本质区别在于:
| 维度 | Coding Plan(旧) | Token Plan(新) |
|---|---|---|
| 计费方式 | 固定月费 | 按 Token 用量计费 |
| 使用上限 | 无限制(但受限于售罄) | 用多少付多少 |
| 成本控制 | 厂商承担 | 开发者承担 |
| 性价比 | 轻度用户划算 | 重度用户更灵活 |
社区普遍反映,转向 Token Plan 后,使用成本出现了"膝盖斩"级别的上涨。
一个中等强度的开发者,月度支出可能从原来的 40 元上涨至 100-300 元不等。
但换个角度看,这也意味着:
- 不再需要"抢购"套餐,随时可用
- 按需付费,低频用户反而更省钱
- 厂商可持续,不会因为亏损而突然停服
全球视角:这不是中国独有的现象
Coding Plan 的退潮并非中国市场的孤立事件。放眼全球,类似的趋势也在发生:
- Alibaba(国际版):2026 年 3 月 20 日停售 Coding Plan Lite($3/月),Pro 版涨至$50/月
- Cursor / GitHub Copilot:持续调整定价策略,逐步收紧无限使用额度
- Claude Code / Codex CLI:均转向更细粒度的用量计费
全球 AI 厂商都在经历同一个课题:如何在推广 AI 普及和控制算力成本之间找到平衡?
开发者的应对策略
1. 转向按量计费(Token Plan)
这是最直接的迁移路径。虽然单价看起来更高,但对于非重度用户,实际月度支出未必比包月贵太多。
2. 多平台组合使用
不要依赖单一平台。将不同平台的 Token Plan 组合使用,可以在不同场景下获得最优性价比。
3. 关注开源/本地部署方案
如果算力成本持续上升,本地部署开源模型(如 Qwen-Coder、DeepSeek-Coder)可能是长期最经济的方案。
4. 优化使用习惯
- 减少不必要的模型调用
- 优先使用本地推理能力
- 合理选择模型(简单任务用小模型,复杂任务用大模型)
苏米注:Coding Plan 的退潮,标志着 AI 编程服务进入了新阶段——从"烧钱获客"到"可持续经营",从"一刀切"到"精细化",从"工具依赖"到"能力内化"。这场转向对短期使用者来说或许是"阵痛",但从长期看,只有当商业模式可持续时,AI 编程服务才能真正稳定、可靠地服务于每一位开发者。
一键订阅Token Plan入口:https://www.aliyun.com/benefit/scene/tokenplan