OpenAI 與 Cerebras 近日簽署多年協議,計劃自 2026 年起分階段部署 750 兆瓦的 Cerebras 晶圓級系統,用於服務 OpenAI 客户。該部署將成為全球規模最大的高速 AI 推理基礎設施。知情人士稱交易規模超過 100 億美元。
雙方表示,此次合作的核心目標是提升 OpenAI 模型的實時推理能力,加快當前仍需較長處理時間的響應速度。
OpenAI 在博客中指出,這些系統將縮短複雜任務的處理時延,使交互更加自然。Cerebras 聯合創始人兼 CEO Andrew Feldman 表示,正如寬帶改變互聯網一樣,實時推理將改變 AI。
Cerebras 成立已逾十年,但自 2022 年 ChatGPT 推出後迅速受到關注。公司聲稱其基於自研 AI 芯片的系統在速度上優於基於英偉達 GPU 的方案。
雙方自 2017 年起持續交流,此次合作標誌着大模型與專用硬件架構的深度融合。Cerebras 系統在運行大語言模型時,響應速度較 GPU 方案最高提升 15 倍,顯著降低延遲。OpenAI 的 Sachin Katti 表示,Cerebras 為其平台提供了專用低延遲推理能力,將支撐更自然、實時的 AI 交互體驗。Cerebras 稱,其晶圓級技術將通過此次合作觸達數億乃至數十億用户。