10+年产品经理聊聊产品、测测产品,产品人交流学习成长平台,按 Ctrl+D 收藏我们
关于我 留言板 小程序 标签云

苏米客

  • 首页
  • AIGC
    • AI最新动态
    • AI学习教程
    • AI工具集合
    • AI产品百科
    • AI编程开发
    • AI提示词
    • AI开源项目
    • AI智能体
  • Axure
    • Axure动态
    • Axure教程
  • 产品
    • 用户体验
    • 产品设计
    • 苏米杂谈
  • 资源
    • 产品UI组件库
    • 开源图标库
    • 中后台框架
  • 书单
    • AI书籍
    • 用户体验
    • UI视觉
    • 产品研究
    • 其他类型
  • 下载
    • Axure组件
    • Axure原型
    • 文档报告
    • 素材资源
  • 登录
  • 首页
  • AIGC
    • AI最新动态
    • AI学习教程
    • AI工具集合
    • AI产品百科
    • AI编程开发
    • AI提示词
    • AI开源项目
    • AI智能体
  • Axure
    • Axure动态
    • Axure教程
  • 产品
    • 用户体验
    • 产品设计
    • 苏米杂谈
  • 资源
    • 产品UI组件库
    • 开源图标库
    • 中后台框架
  • 书单
    • AI书籍
    • 用户体验
    • UI视觉
    • 产品研究
    • 其他类型
  • 下载
    • Axure组件
    • Axure原型
    • 文档报告
    • 素材资源
当前位置: 首页 » AI最新动态

Token 定价大揭秘:一边涨价疯抢一边永久降价,海外价格差 100 倍

1小时前 AI最新动态 17 0

最近 Token 市场越来越热闹。Agent 调用量的暴增,Anthropic、智谱等 AI 公司恐怖的 ARR 增幅,让各方都拼命挤向 Token 服务市场。多方混战之下,Token 价格成了当前大家最为关注的事情。

市场上 Token 的价格信息非常混乱,对于普通人而言完全搞不懂百万 token 到底值多少。对于很多业内人士,对定价也很头疼:

  • 一边是纷纷提价:各大平台大幅上调 Coding Plan 的门槛价或改变计费模式来应对算力成本的激增。阿里百炼平台上曾经爆火的 Lite 版套餐早已停售,200 元/月的 Pro 版还要抢购,智谱、Seedance 等都不同程度变相涨价。
  • 另一边是大幅降价:DeepSeek、小米 Mimo 模型又宣布永久降价。DeepSeek 输出 2 元/百万 token,输入缓存命中低至 0.025/百万 token。小米 Mimo 宣布降价 99%,价格直降对标 DeepSeek。
  • 海外更是贵 100 倍:Claude Opus 4.7、GPT-5.5 等百万 Token 输出在 20 美元以上,几乎相差了 100 倍。

苏米注:这些纷繁复杂的信息背后,不管是对运营方还是用户,都有一个核心问题:token 到底该值多少钱?

成本端:算出一个锚点

回答 token 值多少钱,先从成本端算起。请教了几个业内朋友,居然对 token 的成本也都不是那么确定,因为不同的电费、不同的 GPU、不同的模型、不同的折旧时限等因素,算下来 token 成本可以差异巨大。

为了有个锚点,先简单用几个基本假设来测算成本。采用等效 H100、GPU 折旧按 3 年、电力成本按 0.5 元、PUE 按 1.3、利用率按 70%、采用 70B 参数精度 FP8 来测算:

  • 单卡日成本 = 折旧成本约 220 元/日 + 单日电费 16 元 + 运维费 20 元/日 = 256 元
  • 单卡单日产出输出 token = 300×3600×24×0.7 = 14 百万 token
  • 单卡单日产出输入 token = 2500×3600×24×0.7 = 151 百万 token

得出:

  • 百万输出 token 成本 = 256/14 = 18.4 元
  • 百万输入 token 成本 = 256/151 = 1.7 元

如果是长上下文(32K~128K)产出还得打折,输出成本直奔 30 元。这个结果在量级上应该差不多,很多国内模型的输出定价都介乎 20 元到 30 元左右,输入定价在 1 到 2 元左右。

三个反直觉结论

真正去算一下成本,有几个反直觉结论:

  • 电费影响没有想象中大:虽然电费在运营变动成本里占比很高,但由于现在算力设备昂贵、迭代迅速,如果要更为合理地做资产折旧的话,电费整体影响没有想象中大。电的影响,更多是有没有电力资源、批不批建设。
  • 国外算力成本并不比国内多:按以上成本构成来测算,考虑到算力卡等因素占比更高,国外 AI 算力成本实际和国内差不多。交叉验证了下,有海外算力租用,H100 的价格大概在 2 美元 1 小时,一天大约 336 元人民币,和前面测算大差不差。
  • 国外模型定价差异不在成本:国内模型远比几个国外大厂模型便宜,更多在于其他因素。国内的模型定价大多贴着成本在定,并没有想象中那么赚钱。而海外 Claude、GPT 等模型,定价在 20 刀以上,利润是比较高的。

用户端:重要的不是 Token 量,而是价值密度

当前国内 Token 语境中,有点过度强调 token 的标准性,给普通人一种 token 就是未来的水电煤的印象。但实际上,Token 承载的是信息、推理、行动和结果。

就如同雇佣一个员工一样,不同人产生的价值差异巨大。同样 100 万 token,有的能直接帮你做正确判断、准确按需求开发好的代码,有些可能做了大半天后方向有问题。

苏米注:好的模型,比如 Claude,做同样的事情使用的 token 量并不大,就像一个惜字如金但水平极高的工程师。有些模型做一个事情会反复思考、反复试错,花了不少精力和时间才能搞定一个事情。前者哪怕贵一点,用户也愿意买单。因为用户最终买的,从来不是 token 本身,而是 token 带来的结果。

所以,token 反映的不是字数,它本质上是智能载体,它的价格取决于价值密度,也就是单位 token 数量能干活的程度。这是 token 定价最底层的逻辑。

尤其是对于 2B 而言,采购 Token 相当于采购人力,其价格最高不能高于同等水平的人力成本。Claude 近期 ARR 的暴增,很大程度是其模型的严谨性、幻觉低、可用性很高,实现了对很多公司法律事务、软件开发等工作的替代。对于商业公司而言,支出 Token 费用远远低于雇佣人的费用。

DeepSeek 掀桌子:工程创新带来的竞争范式

前面的分析,基本可以解释大部分情况:大部分模型厂商按照成本定价,部分优质模型厂商按照市场价值定价。但为何 DeepSeek 和 Mimo 在算力成本高企的当下,突然大幅降价?答案是:用工程技术创新,倒逼竞争。

两者的定价都无限接近:

  • 输入缓存命中降到了 0.025/百万 token
  • 输入和输出,普通版和 Pro 版都是 1 元/3 元/2 元/6 元水平

价格不仅远低于国外模型,比国内阿里千问、腾讯混元、Kimi、智谱都低几倍。降价背后是工程创新:

  • DeepSeek:MoE + 稀疏注意力 + 自研 KV 长缓存 + 国产推理算力
  • 小米 Mimo:MoE 专家并行优化 + Hybrid SWA + 分层 KV 缓存

这些本质上都是极致的工程创新提升效率,把算力和电力都用到用户真正需要的地方。

苏米观察:现在 Agent 才是当前 token 消耗真正放大的地方。Chat 的 token 量是很少的,而 Agent 一个任务里包含了长上下文、多轮推理、代码生成、工具调用、网页读取、文件分析和结果校验。大量把对话、记忆内容作为输入,所以增大缓存命中是降本的核心。

这一轮的降价,给 Token 的竞争带来了更多有意思的角度。之前各大服务商重点是拼算力基础设施,但 DeepSeek 们证明了,技术是可以降维打击的。更优质的模型、更完美的场景适配、低几倍的价格,一定会逐步蚕食市场。

总结:Token 之争,本质还是技术之争

回到最初的问题,Token 到底该值多少钱?

  • 从传统成本看,它值 20 元/百万输出
  • 从价值产出看,不同模型可以差异巨大,它可以值 200 元/百万输出
  • 从新技术带来的效率创新看,它可以值 2 元/百万输出

它既是能力价值之争,也是成本效率之争。能力价值决定了上限,成本效率决定了下限。技术的因素,远比过往重要。Token 战争才刚刚开始,远比我们想象中精彩。

声明:本站原创文章文字版权归本站所有,转载务必注明作者和出处;本站转载文章仅仅代表原作者观点,不代表本站立场,图文版权归原作者所有。如有侵权,请联系我们删除。
未经允许不得转载:Token 定价大揭秘:一边涨价疯抢一边永久降价,海外价格差 100 倍
#Token定价 #AI算力 #DeepSeek #智谱 #Claude 
收藏 1
DeepSeek 首次大规模限流:免费时代终结,AI 行业付费时代来临
提示词:把Dynamic Workflows成本从6.2万美元狂砍到129美元的拆解15个提示词
推荐阅读
  • Mistral 3 来了:这次只对标中国模型
  • Claude Opus 4.7 发布:长任务处理能力与自我验证升级,企业测试数据详解
  • 又是“最强模型”的一天!Google Gemini 2.5 Pro更新,性能再次跃升
  • Claude Cowork 现已向所有 Pro 用户(及以上)开放,刚发布就被拆解!
  • SkyClaw 免费 Agent 模型:无限 Token,适配 OpenClaw、Hermes、Nanobot
评论 (0)
请登录后发表评论
分类精选
Cursor 限制国内使用 Claude 等模型解决方案!
30675 10月前
学生/非学生:如何申请Cursor Pro免费会员,如何通过SheerID验证快速激活全攻略
27856 1年前
即梦AI图片2.1:一句话快速生成带中文的海报图,免费AI文生图、视频工具、AIGC创作工具
19306 1年前
注意!Cursor单设备登录新规:一个账户最多可以3台设备登录,且限制单点登录
19224 1年前
DeepSeek宣布:降价,最高降价75%!别错过这个优惠时段,赶紧充值
15978 1年前
Trae国内版,搭载 doubao-1.5-pro、DeepSeek R1/V3模型,对比 Trae 国际版有什么不同
15717 1年前
字节推出Trae CLI :Claude Code 和 Gemini CLI的国产平替 ?手把手教你如何安装Trae Agent
15298 11月前
刚刚!Cursor风控又加强了,可能是因为这个原因!
14713 1年前
字节跳动发布"扣子空间":AI协同办公的通用Agent平台开启效率革命
14165 1年前
Cline:自动化编程的VSCode插件Claude Dev + Gemini 2.0,快速构建智能应用
12450 1年前

文章目录

关注「苏米客」公众号

订阅推送更及时,手机查看更方便
分类排行
1 提示词:把Dynamic Workflows成本从6.2万美元狂砍到129美元的拆解15个提示词
2 Token 定价大揭秘:一边涨价疯抢一边永久降价,海外价格差 100 倍
3 DeepSeek 首次大规模限流:免费时代终结,AI 行业付费时代来临
4 ChatGPT 史上最大改版:从聊天机器人到超级 App,Codex 周活突破 500 万
5 微信 A2A 能力正式上线:语音操控,双手自由
6 谷歌开源 Gemma 4 12B:统一无编码器架构,16GB 内存笔记本即可运行多模态模型
7 Kimi Work 桌面 Agent:支持 300 个 Agent 并行,实现网页数据抓取与分析
8 Codex 发布 6 大角色插件包:非程序员也能让 AI 替你干活
9 Qwen3.7-Plus正式发布:多模态混合智能体,视觉与语言统一的新基座
10 Holo3.1开源Computer Use模型发布:35B版性能超越Qwen3.5、Claude Sonnet 4.6
©2015-2024 苏米客XMSUMI 版权所有 · WWW.XMSUMI.COM 闽ICP备14005900号-6
微信文章助手 程序库 免费影视APP 免费字体下载 Axure RP 10 免费Axure模板 Axure元件库下载 申请友联