AI 行业又出现一家千亿级公司
5 月 27 日,据彭博社报道,美国 AI 推理平台 Fireworks AI 正在洽谈新一轮融资,目标估值 150 亿美元(约 1024 亿元人民币)
而 7 个月前,它的估值还是 40 亿美元
2024 年 7 月,B 轮估值仅 5.52 亿美元。不到两年,Fireworks AI 估值暴涨约 27 倍。

更猛的是收入。研究机构 Sacra 数据显示:2026 年 2 月,Fireworks AI 年化收入已经达到 3.15 亿美元(约 22 亿元人民币),同比增长 416%,较 2024 年 B 轮时增长约 3-4 倍。

与此同时,它的平台每天处理约 15 万亿 Token。这个数字是什么概念?国家数据局此前披露:2025 年 12 月,中国日均 Token 消耗量约 100 万亿。也就是说,Fireworks AI 一家公司的日 Token 处理量,已经接近中国全社会 AI 调用量的 15%。而它成立才不到 4 年。
一帮华人,在 AI 行业卖 Token
Fireworks AI 成立于 2022 年,总部位于美国加州 Redwood City。公司共有 7 位联合创始人,其中 3 位是华人。
CEO 乔琳(Lin Qiao):复旦本科、硕士,UCSB 博士,前 Meta 工程高级总监。她曾主导 PyTorch 在数据中心、移动设备和 AR/VR 设备上的开发部署。

另外两位华人联合创始人:Benny Chen 曾在 Meta 做到首席软件工程师;Chenyu Zhao 则长期负责 Google Cloud Vertex AI 相关业务。
这家公司不训练大模型,也不直接做 AI 应用。它做的事情很简单:帮企业运行各种开源模型,然后按 Token 收费。目前,其支持的模型包括 DeepSeek、Kimi、MiniMax 等多家开源或开放 API 模型。
开发者无需自己购买 GPU、搭建推理集群或进行底层优化,即可通过兼容 OpenAI 格式的 API 直接调用。而 Fireworks AI 则按调用量收费。AI 应用跑得越猛,它赚得越多。目前,全球最火的 AI 编程工具之一 Cursor,就是其客户。据官方披露:Cursor 在 Fireworks AI 平台上,已经实现 1000 token/秒的生成速度。

钱从"训练"流向"调用"
过去两年,AI 行业最烧钱的地方,是训练。OpenAI、Google、Anthropic、xAI 都在疯狂囤 GPU,单轮大模型训练成本动辄数亿美元。但现在,一个变化开始越来越明显:模型训练越来越像"一次性投入",而推理调用开始变成"长期收费"。
算力结构已经彻底反转:2023 年,全球 AI 算力中训练占 2/3、推理仅 1/3;到 2026 年,推理占比飙升至 65%–70%,是训练算力的 4.5 倍。在中国,这一趋势更极端 —— 推理算力已是训练算力的 8 倍。英伟达黄仁勋甚至判断:未来推理规模将达到训练负载的十亿倍。
市场规模同样爆发:Lightspeed 此前披露:过去 3 年,AI 推理市场已经从 0 增长到超过 50 亿美元。资本也开始疯狂涌入这一赛道。
除了 Fireworks AI,Baseten 最近被曝出正以 110 亿美元估值融资,Together AI 估值达到 75 亿美元,Modal 估值 46.5 亿美元,Fal 估值 45 亿美元。其中,Baseten 在 2026 年 1 月刚完成一轮融资估值 50 亿美元,5 个月后新一轮融资估值直接翻倍至 110 亿美元。
更夸张的是收入增速。据 The Information 报道:Baseten 年化收入已经从 2026 年初的 2 亿美元,增长到 Q1 末的 6 亿美元。3 个月,增长 200%。
这些公司有一个共同特点:它们都不直接做大模型,而是帮整个 AI 行业"跑模型"——做 AI 时代的"卖水人",靠永续的 Token 调用收费,赚取长期、稳定的现金流。
NVIDIA 等巨头进场投资
Fireworks AI 背后的投资方越来越豪华。其股东包括 Lightspeed、Index Ventures、红杉资本,以及 NVIDIA 和 AMD。原因很现实:AI 应用爆发后,整个行业真正稀缺的东西开始变成 GPU,而推理平台本质上是在帮助整个行业更高效率地使用 GPU。
NVIDIA 此前曾公开表示:基于 Blackwell 架构的新一代推理系统,已经将单 Token 成本降低约 10 倍。在部分大模型场景下,成本甚至可降至原来的 1/35。这意味着,DeepSeek、Llama 3、Kimi 等开源模型,在推理成本上已接近甚至挑战 GPT-4 等闭源 API,性价比拐点正式到来。而谁能把 Token 成本压得更低,谁就更容易拿下 AI 应用公司。
目前,Fireworks AI 估值对应约 3.15 亿美元 ARR,市销率约 47 倍。放在 2023 年 AI 泡沫期,这个数字不算离谱。横向对比同行:Together AI 估值 75 亿美元、对应 ARR 约 1.5 亿美元,市销率约 50 倍;Baseten 估值 110 亿美元、对应 ARR 约 6 亿美元,市销率约 18 倍。

放在 2023 年 AI 泡沫期,头部 AI 公司市销率普遍在 80–150 倍,这个数字不算离谱;在 2026 年,这种估值仍能成立,核心原因是 AI 调用量仍在爆炸式增长。Fireworks AI 的平台日 Token 处理量,已从 2025 年底的 10 万亿增长到 2026 年 5 月的 15 万亿,5 个月增长 50%。按此增速,2026 年底有望突破 25 万亿/日,全年处理量将超 7000 万亿 Token——相当于为全球 AI 应用提供了近 1/5 的推理算力支撑。
中国,何时出现千亿公司?
Fireworks AI 最值得关注的,其实不只是 150 亿美元估值,而是"按 Token 收费"这件事已经真正形成商业规模。过去很多人认为推理平台只是技术服务,但现在 3.15 亿美元年化收入、416% 增速、15 万亿日 Token 处理量,这些数字已经说明:AI 调用本身,正在变成一门真正的大生意。
这也是为什么国内越来越多公司开始进入推理层,包括硅基流动、无问芯穹,以及越来越多 AI Infra 创业公司。仅 2025–2026 年,国内新增推理赛道创业项目就超过 200 家。
过去几年,AI 行业拼的是谁能训练更大的模型。而现在,越来越多人开始盯上另一件事:谁能替整个 AI 行业,更低成本地"跑模型"。
本文信源:Bloomberg、Sacra、AIWire、The Information、Fireworks AI 官网等。融资尚未最终完成,估值可能变化。