AInspiro
EN

OpenAI自研芯片Jalapeño发布:推理成本砍半,9个月从零流片

技术趋势
🤖 本文由 AI 生成,内容仅供参考。

OpenAI出芯片了:跟英伟达抢饭吃,推理成本砍一半

6月24日,OpenAI发布了第一款自研AI芯片——Jalapeño(哈拉贝诺辣椒)。

不是PPT发布,是已经流片成功、在实验室跑着GPT-5.3的真实硅片。9个月从零设计到流片,博通负责硅实现,台积电3nm工艺代工。

这颗芯片,可能比GPT-5.6更值得关注。

Jalapeño是什么

简单说:一颗专为大语言模型推理设计的ASIC芯片。不像英伟达GPU那样通用,但针对LLM推理做了深度优化——降低数据搬运、平衡计算和内存、让实际利用率更接近理论峰值。

博通CEO陈福阳透露,早期测试显示推理成本比当前主流GPU省约50%。

对每天处理数亿次API调用的OpenAI来说,这个是命脉。推理成本降一半,意味着要么利润翻倍,要么降价抢市场——哪个都对竞争对手是坏消息。

为什么9个月能造出来

正常设计一款ASIC要1.5-2年。Jalapeño只用了9个月。OpenAI硬件主管Richard Ho说是深度软硬件协同——用自家前沿模型辅助架构探索和功耗仿真,博通提供硅实现。

说白了就是"AI帮人造AI芯片"。Greg Brockman的原话:"我们用服务用户的前沿模型,来优化运行未来模型的基础设施。"

一个有意思的转折:Jalapeño的代号来自墨西哥辣椒。OpenAI这次没取什么高大上的名字,直接上了厨房。可能是想表达——我们造芯片就像炒菜一样快。

对行业意味着什么

第一,OpenAI正式加入"去英伟达"阵营。谷歌有TPU,微软有Maia,亚马逊有Trainium,现在OpenAI也有了自己的芯片。全栈竞争——模型+芯片+系统+网络——已经是大势。

但OpenAI不是要完全抛弃英伟达。Brockman说得很直白:"我们根本无法足够快地获得算力。"Jalapeño是对爆炸性算力需求的结构性补充,不是替代。短期内英伟达的地位不会动摇,但长期来看,客户正在被分流。

第二,芯片交付和部署才是真正的考验。Jalapeño计划2026年底前完成初始部署,微软等合作伙伴会在千兆瓦级数据中心部署。但从工程样品到稳定量产,中间可能还有不少坑。

第三,博通是隐形赢家。Jalapeño用了博通的Tomahawk网络芯片和高速互联技术,这些会随Jalapeño平台规模化变现。博通已经悄悄成为了AI芯片战争的关键军火商。

如果你是做AI应用的开发者,这个趋势该关注——芯片成本持续下降,意味着API价格会继续降。推理越来越便宜,能做的应用场景就越来越多。