OpenAI正考虑将其内部开发的跨芯片软件优化工具对外公开,此举若落地,将直接冲击英伟达长期以来凭借CUDA软件生态构筑的护城河。
6月1日,据科技媒体The Information报道,OpenAI负责计算与基础设施的高级副总裁Sachin Katti在一场公开讨论中表示,该公司正在开发一套软件抽象层,使研究人员和产品团队在运行AI工作负载时无需关心底层硬件来自哪家供应商。
当被问及是否会将这一能力对外开放时,Katti明确表示"这在考虑范围之内",并将其描述为"智能体优化能力(agentic optimization capability)",称"我们希望将这一能力提供给全世界"。
分析称,这一表态意义重大。英伟达的市场主导地位长期以来有赖于CUDA——这套专有的编译器、函数库与优化工具体系,是主流AI开发者在英伟达芯片上运行软件的核心依赖。一旦OpenAI的跨平台工具公开发布,将进一步削弱CUDA的差异化优势,加速AI算力市场的多元化竞争格局。
多芯片战略提速,OpenAI加速摆脱英伟达依赖
据报道,Katti在讨论中直言,AI行业将走向"高度异构化",各家公司将同时使用来自多家供应商的AI芯片。这一判断背后,是OpenAI自身战略的深刻转变。
OpenAI此前几乎完全依赖英伟达芯片,但近期已相继与亚马逊、Cerebras及AMD签署协议,引入其AI芯片资源,同时还在自研定制AI芯片。
Katti在讨论中未透露OpenAI是否会像Anthropic和Meta那样采用谷歌的定制芯片。
这一趋势并非OpenAI独有。Anthropic和Meta同样不愿在如此核心的业务环节上依赖单一供应商,且没有任何一家供应商能够单独满足其庞大的算力需求。
软件抽象层:谷歌Borg模式的AI版本
报道称,Katti将OpenAI正在构建的软件体系类比于谷歌著名的Borg计算管理系统——后者正是谷歌得以跨异构硬件大规模扩展产品的关键基础设施。"这就是我们在AI领域正在走的路,"他说。
更具颠覆性的是,Katti暗示AI本身将成为打破CUDA垄断的工具。"我们预计将利用AI生成优化内核(optimized kernels),从而真正支持所有这些不同的芯片选项,"他表示。
Amp创始人Anjney Midha在同一讨论中指出,如果OpenAI这类开发者将此类内部工具公开发布,使AI能够高效运行于英伟达、谷歌、AMD等多家芯片之上,将对英伟达构成实质性冲击。
事实上,CUDA的护城河已在悄然收窄。Meta开发的PyTorch框架早已让开发者能够更便捷地为多种芯片编写AI代码,部分初创公司也在销售AI工具,将PyTorch代码转译为可直接在芯片上运行的底层代码。
Vera Rubin芯片部署在即,算力瓶颈转向电力与工程
除软件战略外,Katti还披露了OpenAI在英伟达下一代Vera Rubin芯片系统上的部署进展。他表示,OpenAI已获得该芯片的早期样品,预计将于今年年底将其投入AI训练使用。
Katti对英伟达在Blackwell系统推出过程中暴露的问题给予了正面评价,认为英伟达已从中汲取经验。Blackwell初代系统在规模化部署时曾因网络、固件和布线复杂性令多家云服务商头疼,但新版系统已大幅改善。"英伟达确实从诸多成长阵痛中学到了东西,"他说。
Katti未透露哪家云服务商将率先承载OpenAI的Vera Rubin集群,仅表示各方之间存在"良性竞争"。OpenAI目前的主要云服务商包括微软、甲骨文和亚马逊。
值得关注的是,Katti将当前算力扩张的最大瓶颈指向了电力供应与工程能力,而非芯片本身。
"目前制约我们的更多是电力和工程能力,而非其他,"他说。这一判断对AI基础设施投资者的资源配置方向具有直接参考价值。