10+年产品经理聊聊产品、测测产品,产品人交流学习成长平台,按 Ctrl+D 收藏我们
关于我 留言板 小程序 标签云

苏米客

  • 首页
  • AIGC
    • AI最新动态
    • AI学习教程
    • AI工具集合
    • AI产品百科
    • AI编程开发
    • AI提示词
    • AI开源项目
    • AI智能体
  • Axure
    • Axure动态
    • Axure教程
  • 产品
    • 用户体验
    • 产品设计
    • 苏米杂谈
  • 资源
    • 产品UI组件库
    • 开源图标库
    • 中后台框架
  • 书单
    • AI书籍
    • 用户体验
    • UI视觉
    • 产品研究
    • 其他类型
  • 下载
    • Axure组件
    • Axure原型
    • 文档报告
    • 素材资源
  • 登录
  • 首页
  • AIGC
    • AI最新动态
    • AI学习教程
    • AI工具集合
    • AI产品百科
    • AI编程开发
    • AI提示词
    • AI开源项目
    • AI智能体
  • Axure
    • Axure动态
    • Axure教程
  • 产品
    • 用户体验
    • 产品设计
    • 苏米杂谈
  • 资源
    • 产品UI组件库
    • 开源图标库
    • 中后台框架
  • 书单
    • AI书籍
    • 用户体验
    • UI视觉
    • 产品研究
    • 其他类型
  • 下载
    • Axure组件
    • Axure原型
    • 文档报告
    • 素材资源
当前位置: 首页 » AI最新动态

华人团队主导AI推理平台Fireworks AI 估值暴涨27倍至150亿美元

1小时前 AI最新动态 17 0

AI 行业又出现一家千亿级公司

5 月 27 日,据彭博社报道,美国 AI 推理平台 Fireworks AI 正在洽谈新一轮融资,目标估值 150 亿美元(约 1024 亿元人民币)

而 7 个月前,它的估值还是 40 亿美元

2024 年 7 月,B 轮估值仅 5.52 亿美元。不到两年,Fireworks AI 估值暴涨约 27 倍。

图片 1

更猛的是收入。研究机构 Sacra 数据显示:2026 年 2 月,Fireworks AI 年化收入已经达到 3.15 亿美元(约 22 亿元人民币),同比增长 416%,较 2024 年 B 轮时增长约 3-4 倍。

图片 2

与此同时,它的平台每天处理约 15 万亿 Token。这个数字是什么概念?国家数据局此前披露:2025 年 12 月,中国日均 Token 消耗量约 100 万亿。也就是说,Fireworks AI 一家公司的日 Token 处理量,已经接近中国全社会 AI 调用量的 15%。而它成立才不到 4 年。

一帮华人,在 AI 行业卖 Token

Fireworks AI 成立于 2022 年,总部位于美国加州 Redwood City。公司共有 7 位联合创始人,其中 3 位是华人。

CEO 乔琳(Lin Qiao):复旦本科、硕士,UCSB 博士,前 Meta 工程高级总监。她曾主导 PyTorch 在数据中心、移动设备和 AR/VR 设备上的开发部署。

图片 3

另外两位华人联合创始人:Benny Chen 曾在 Meta 做到首席软件工程师;Chenyu Zhao 则长期负责 Google Cloud Vertex AI 相关业务。

这家公司不训练大模型,也不直接做 AI 应用。它做的事情很简单:帮企业运行各种开源模型,然后按 Token 收费。目前,其支持的模型包括 DeepSeek、Kimi、MiniMax 等多家开源或开放 API 模型。

开发者无需自己购买 GPU、搭建推理集群或进行底层优化,即可通过兼容 OpenAI 格式的 API 直接调用。而 Fireworks AI 则按调用量收费。AI 应用跑得越猛,它赚得越多。目前,全球最火的 AI 编程工具之一 Cursor,就是其客户。据官方披露:Cursor 在 Fireworks AI 平台上,已经实现 1000 token/秒的生成速度。

图片 4

钱从"训练"流向"调用"

过去两年,AI 行业最烧钱的地方,是训练。OpenAI、Google、Anthropic、xAI 都在疯狂囤 GPU,单轮大模型训练成本动辄数亿美元。但现在,一个变化开始越来越明显:模型训练越来越像"一次性投入",而推理调用开始变成"长期收费"。

算力结构已经彻底反转:2023 年,全球 AI 算力中训练占 2/3、推理仅 1/3;到 2026 年,推理占比飙升至 65%–70%,是训练算力的 4.5 倍。在中国,这一趋势更极端 —— 推理算力已是训练算力的 8 倍。英伟达黄仁勋甚至判断:未来推理规模将达到训练负载的十亿倍。

市场规模同样爆发:Lightspeed 此前披露:过去 3 年,AI 推理市场已经从 0 增长到超过 50 亿美元。资本也开始疯狂涌入这一赛道。

除了 Fireworks AI,Baseten 最近被曝出正以 110 亿美元估值融资,Together AI 估值达到 75 亿美元,Modal 估值 46.5 亿美元,Fal 估值 45 亿美元。其中,Baseten 在 2026 年 1 月刚完成一轮融资估值 50 亿美元,5 个月后新一轮融资估值直接翻倍至 110 亿美元。

更夸张的是收入增速。据 The Information 报道:Baseten 年化收入已经从 2026 年初的 2 亿美元,增长到 Q1 末的 6 亿美元。3 个月,增长 200%。

这些公司有一个共同特点:它们都不直接做大模型,而是帮整个 AI 行业"跑模型"——做 AI 时代的"卖水人",靠永续的 Token 调用收费,赚取长期、稳定的现金流。

NVIDIA 等巨头进场投资

Fireworks AI 背后的投资方越来越豪华。其股东包括 Lightspeed、Index Ventures、红杉资本,以及 NVIDIA 和 AMD。原因很现实:AI 应用爆发后,整个行业真正稀缺的东西开始变成 GPU,而推理平台本质上是在帮助整个行业更高效率地使用 GPU。

NVIDIA 此前曾公开表示:基于 Blackwell 架构的新一代推理系统,已经将单 Token 成本降低约 10 倍。在部分大模型场景下,成本甚至可降至原来的 1/35。这意味着,DeepSeek、Llama 3、Kimi 等开源模型,在推理成本上已接近甚至挑战 GPT-4 等闭源 API,性价比拐点正式到来。而谁能把 Token 成本压得更低,谁就更容易拿下 AI 应用公司。

目前,Fireworks AI 估值对应约 3.15 亿美元 ARR,市销率约 47 倍。放在 2023 年 AI 泡沫期,这个数字不算离谱。横向对比同行:Together AI 估值 75 亿美元、对应 ARR 约 1.5 亿美元,市销率约 50 倍;Baseten 估值 110 亿美元、对应 ARR 约 6 亿美元,市销率约 18 倍。

图片 5

放在 2023 年 AI 泡沫期,头部 AI 公司市销率普遍在 80–150 倍,这个数字不算离谱;在 2026 年,这种估值仍能成立,核心原因是 AI 调用量仍在爆炸式增长。Fireworks AI 的平台日 Token 处理量,已从 2025 年底的 10 万亿增长到 2026 年 5 月的 15 万亿,5 个月增长 50%。按此增速,2026 年底有望突破 25 万亿/日,全年处理量将超 7000 万亿 Token——相当于为全球 AI 应用提供了近 1/5 的推理算力支撑。

中国,何时出现千亿公司?

Fireworks AI 最值得关注的,其实不只是 150 亿美元估值,而是"按 Token 收费"这件事已经真正形成商业规模。过去很多人认为推理平台只是技术服务,但现在 3.15 亿美元年化收入、416% 增速、15 万亿日 Token 处理量,这些数字已经说明:AI 调用本身,正在变成一门真正的大生意。

这也是为什么国内越来越多公司开始进入推理层,包括硅基流动、无问芯穹,以及越来越多 AI Infra 创业公司。仅 2025–2026 年,国内新增推理赛道创业项目就超过 200 家。

过去几年,AI 行业拼的是谁能训练更大的模型。而现在,越来越多人开始盯上另一件事:谁能替整个 AI 行业,更低成本地"跑模型"。

本文信源:Bloomberg、Sacra、AIWire、The Information、Fireworks AI 官网等。融资尚未最终完成,估值可能变化。

声明:本站原创文章文字版权归本站所有,转载务必注明作者和出处;本站转载文章仅仅代表原作者观点,不代表本站立场,图文版权归原作者所有。如有侵权,请联系我们删除。
未经允许不得转载:华人团队主导AI推理平台Fireworks AI 估值暴涨27倍至150亿美元
#Fireworks AI #AI推理 #Token经济 #华人创业 
收藏 1
WinClaw 永久免费 Token 白嫖教程:从下载到激活一步到位
这是最后一篇
推荐阅读
  • Cursor定价翻车:Cursor 悄悄调整 Pro 方案定价,并发声明
  • KAT-Coder-Pro V2发布:Claude Code + KAT-Coder-Pro V2实测新一代代码助手在前端生成与审美上显著进化
  • 震惊!这个开源项目挖了Cursor、v0、Manus等完整的各大AI模型官方系统提示词
  • 百度发布首款搭载中文 大模型的小度AI眼镜,支持边走边问、第一视角拍摄
  • 谷歌确认今年内发布 Gemini 3,但时间可能顺延
评论 (0)
请登录后发表评论
分类精选
Cursor 限制国内使用 Claude 等模型解决方案!
30434 10月前
学生/非学生:如何申请Cursor Pro免费会员,如何通过SheerID验证快速激活全攻略
27459 1年前
注意!Cursor单设备登录新规:一个账户最多可以3台设备登录,且限制单点登录
18970 1年前
即梦AI图片2.1:一句话快速生成带中文的海报图,免费AI文生图、视频工具、AIGC创作工具
18949 1年前
DeepSeek宣布:降价,最高降价75%!别错过这个优惠时段,赶紧充值
15874 1年前
Trae国内版,搭载 doubao-1.5-pro、DeepSeek R1/V3模型,对比 Trae 国际版有什么不同
15491 1年前
字节推出Trae CLI :Claude Code 和 Gemini CLI的国产平替 ?手把手教你如何安装Trae Agent
15063 10月前
刚刚!Cursor风控又加强了,可能是因为这个原因!
14560 1年前
字节跳动发布"扣子空间":AI协同办公的通用Agent平台开启效率革命
14071 1年前
Cline:自动化编程的VSCode插件Claude Dev + Gemini 2.0,快速构建智能应用
12335 1年前

文章目录

关注「苏米客」公众号

订阅推送更及时,手机查看更方便
分类排行
1 豆包即将收费:价格体系、服务分层与底层商业逻辑分析
2 华人团队主导AI推理平台Fireworks AI 估值暴涨27倍至150亿美元
3 Agnes AI 全模态 API 无限期免费:文本、图像、视频模型实测与接入指南
4 MiniMax M3 即将发布:MSA 稀疏注意力重构大模型效率
5 MiniMax-M2.7 模型在 OpenHands Agent 平台上免费使用
6 OpenAI Codex Computer Use 正式登陆 Windows,附完整设置指南
7 Claude Opus 4.8 深度解析:从聊天机器人到自主工作系统的进化
8 Claude Code Dynamic Workflows:AI 自主调度并行处理复杂任务
9 Step 3.7 Flash:10 秒生成千行代码,生产级 Agent 的高效率之选
10 Codex Computer Use 登陆 Windows:手机远程调度 AI 成为现实
©2015-2024 苏米客XMSUMI 版权所有 · WWW.XMSUMI.COM 闽ICP备14005900号-6
微信文章助手 程序库 免费影视APP 免费字体下载 Axure RP 10 免费Axure模板 Axure元件库下载 申请友联