10+年产品经理聊聊产品、测测产品,产品人交流学习成长平台,按 Ctrl+D 收藏我们
关于我 留言板 小程序 标签云

苏米客

  • 首页
  • AIGC
    • AI最新动态
    • AI学习教程
    • AI工具集合
    • AI产品百科
    • AI编程开发
    • AI提示词
    • AI开源项目
    • AI智能体
  • Axure
    • Axure动态
    • Axure教程
  • 产品
    • 用户体验
    • 产品设计
    • 苏米杂谈
  • 资源
    • 产品UI组件库
    • 开源图标库
    • 中后台框架
  • 书单
    • AI书籍
    • 用户体验
    • UI视觉
    • 产品研究
    • 其他类型
  • 下载
    • Axure组件
    • Axure原型
    • 文档报告
    • 素材资源
  • 登录
  • 首页
  • AIGC
    • AI最新动态
    • AI学习教程
    • AI工具集合
    • AI产品百科
    • AI编程开发
    • AI提示词
    • AI开源项目
    • AI智能体
  • Axure
    • Axure动态
    • Axure教程
  • 产品
    • 用户体验
    • 产品设计
    • 苏米杂谈
  • 资源
    • 产品UI组件库
    • 开源图标库
    • 中后台框架
  • 书单
    • AI书籍
    • 用户体验
    • UI视觉
    • 产品研究
    • 其他类型
  • 下载
    • Axure组件
    • Axure原型
    • 文档报告
    • 素材资源
当前位置: 首页 » AI最新动态

OpenAI 首款自研芯片 Jalapeño:9 个月从设计到流片,专为推理优化

1小时前 AI最新动态 16 0

OpenAI 的首颗自研 AI 芯片正式亮相,名为 Jalapeño(墨西哥辣椒),由 OpenAI 和 Broadcom 联合发布,专门用于大模型的推理加速。

图片 1

Jalapeño:专为推理优化

Jalapeño 专精于推理优化而非模型训练,官方说法是"blank-slate design for modern LLM inference",兼容所有 LLM。架构层面围绕三条核心思路:减少数据搬运、平衡算力内存网络三者的资源分配、让实际利用率逼近理论峰值。

网络部分由 Broadcom 提供了 Tomahawk 交换芯片。据 SemiWiki 和 Tom's Hardware 报道,Jalapeño 预计采用 TSMC 3nm 工艺制造,架构为脉动阵列(systolic array),搭配高带宽内存(HBM3E 或 HBM4),Arm 为这颗芯片设计了配套 CPU。

9 个月,从设计到流片

从最初设计到进入流片,这款芯片只用了 9 个月。在高性能先进半导体领域,这算是有史以来最快的开发速度——常规高性能 ASIC 设计周期通常是 2 到 3 年。OpenAI 表示:大模型可以用来加速部分设计和优化流程。

OpenAI 的硬件团队由 Richard Ho 领导,他之前在 Google 做 TPU 芯片工程,2023 年 11 月入职 OpenAI。

三方分工

参与芯片制造的三方分别是:

  • OpenAI:芯片架构设计、内核优化、serving 系统
  • Broadcom:硅实现、网络技术(含 Tomahawk 网络芯片)、芯片制造落地
  • Celestica:板卡、机架、系统集成(也是 Google TPU 的首选制造合作伙伴)

Broadcom CEO Hock Tan 表示,与 OpenAI 的合作是为未来十年 AI 所需物理基础设施的规模扩展做出的基本承诺,Jalapeño 只是多代路线图的第一步。从 2026 年开始,将与 Microsoft 等合作伙伴部署千兆瓦级数据中心。

已在运行 GPT-5.3-Codex-Spark

在实验室里,这款芯片已经在进行以生产目标频率和功耗来运行部分模型了,包括 GPT-5.3-Codex-Spark(这个模型可以在 Codex 中使用)。

图片 2

初步测试显示,Jalapeño 的每瓦性能达到 SOTA 水平,具体技术报告会在未来几个月发布。

年底开始部署

部署时间线:2026 年底开始初步部署,之后逐年扩展。整个项目的目标是 GW(吉瓦)级数据中心规模,合作伙伴包括微软等。10GW 大约相当于整个北京市的居民用电量。

这是一个多代平台路线图,Jalapeño 是第一代,第二代芯片代号"Serrano"(也是一种辣椒)。

时间线回顾

  • 2025.10:与 Broadcom 宣布合作,计划部署 10GW 自研加速器
  • 2025.10:与 NVIDIA 达成协议,后者投资最高 1000 亿美元并提供至少 10GW 数据中心系统
  • 2025.10:与 AMD 签了 6GW 芯片供应协议(含 AMD 至多 10% 股权期权)
  • 2026.06:与 Cerebras 签了 750MW 推理算力协议
  • 2026.06.24:Jalapeño 芯片实物交付

整体策略是:自研芯片 + NVIDIA + AMD + Cerebras,四条线并行。Google 有 TPU,Amazon 有 Trainium,Meta 有 MTIA,微软有 Maia——现在 OpenAI 也有 Jalapeño 了。

声明:本站原创文章文字版权归本站所有,转载务必注明作者和出处;本站转载文章仅仅代表原作者观点,不代表本站立场,图文版权归原作者所有。如有侵权,请联系我们删除。
未经允许不得转载:OpenAI 首款自研芯片 Jalapeño:9 个月从设计到流片,专为推理优化
#OpenAI #Jalapeño #AI芯片 #Broadcom #推理加速 
收藏 1
QQ 邮箱 Agently Mail:给 AI Agent 一个独立的工位邮箱
AI时代职场生存:李飞飞说未来只剩两类人,你怎么选?
推荐阅读
  • 豆包即将收费:价格体系、服务分层与底层商业逻辑分析
  • 码上飞:只动嘴,App就能做出来?我用「码上飞」5分钟开发了一个AI应用
  • Claude Cowork 现已向所有 Pro 用户(及以上)开放,刚发布就被拆解!
  • Codex 插件系统详解:将 Skills、应用集成与 MCP 打包成可复用工作流
  • 刚刚!阿里 Qwen3-TTS 发布,语音合成能力大幅提升!
评论 (0)
请登录后发表评论
分类精选
Cursor 限制国内使用 Claude 等模型解决方案!
31292 11月前
学生/非学生:如何申请Cursor Pro免费会员,如何通过SheerID验证快速激活全攻略
28510 1年前
即梦AI图片2.1:一句话快速生成带中文的海报图,免费AI文生图、视频工具、AIGC创作工具
20252 1年前
注意!Cursor单设备登录新规:一个账户最多可以3台设备登录,且限制单点登录
20104 1年前
Trae国内版,搭载 doubao-1.5-pro、DeepSeek R1/V3模型,对比 Trae 国际版有什么不同
16315 1年前
DeepSeek宣布:降价,最高降价75%!别错过这个优惠时段,赶紧充值
16266 1年前
字节推出Trae CLI :Claude Code 和 Gemini CLI的国产平替 ?手把手教你如何安装Trae Agent
15848 11月前
刚刚!Cursor风控又加强了,可能是因为这个原因!
15082 1年前
国产大模型横向对比:Kimi K2.6、GLM-5.1、Qwen3、MiniMax M2 四大模型选型指南
14762 2月前
腾讯ima知识库skills上线:教你如何把腾讯 IMA 知识库接入 OpenClaw 一步打通
14628 2月前

文章目录

关注「苏米客」公众号

订阅推送更及时,手机查看更方便
分类排行
1 OpenAI 首款自研芯片 Jalapeño:9 个月从设计到流片,专为推理优化
2 QQ 邮箱 Agently Mail:给 AI Agent 一个独立的工位邮箱
3 Anthropic 内部管理分享:高 Agency 与高 Accountability 如何共存
4 谷歌 Gemma 4 12B 实测:原生音频理解+256K 上下文,普通笔记本可运行
5 AI 价格战升级:500 家企业从 Claude 转向 DeepSeek,token 成本成企业首要问题
6 字节 Seedance 2.5 内测完成:支持 30 秒原生视频直出,50 个参考素材
7 Anthropic 推出 Claude Tag:让 AI 以团队成员身份加入 Slack 协作
8 Vercel 开源 Agent 框架 eve:约定优于配置的 Agent 开发新范式
9 GLM-5.2 开源模型发布:百万 Token 上下文,Agent 编程能力登顶开放权重模型
10 Transformer 发明人与诺奖得主相继出走:谷歌 AI 的人才流失危机
©2015-2024 苏米客XMSUMI 版权所有 · WWW.XMSUMI.COM 闽ICP备14005900号-6
微信文章助手 程序库 免费影视APP 免费字体下载 Axure RP 10 免费Axure模板 Axure元件库下载 申请友联