輝達(Nvidia)執行長黃仁勳周末在台北才駁斥了不滿 OpenAI 的傳言,還打包票將挹注大筆投資,現卻傳出其實是 OpenAI 對輝達最新的人工智慧晶片表現不甚滿意,早在去年便開始尋覓替代品。驅動AI盛世的兩大引擎,關係浮現微妙變化。
在人工智慧的進化之路,首先是訓練大型模型如 ChatGPT,使之「學習」大量消化資訊的能力,這也是AI產業爆炸性成長的核心。如今重心則進階到了「推論」(inference)階段,亦即將已訓練完成的模型投入實際運作,對全新、未見過的資料進行分析,「運用技能」預測結果或提出決策,如 ChatGPT 即時回應使用者問題與請求的過程。
路透指出,輝達雖在大型 AI 模型訓練晶片領域仍占主導地位,但推論已成 AI 競技的新戰場。路透引述消息人士說法,OpenAI 對於輝達硬體在特定應用場景下(如軟體開發、AI 與其他軟體互動)回應速度感到不滿。其中一人透露,OpenAI 正尋求新硬體,以在未來承擔約 10% 的推論運算需求。
相較於訓練,推論對記憶體的需求更高,因晶片需花費更多時間從記憶體中讀取資料,而非進行純數學運算。目前輝達與 AMD 的 GPU 主要依賴外部記憶體,這增加了延遲,降低了使用者與聊天機器人互動的即時性。
自去年起,OpenAI 開始尋覓 GPU 替代品,將重點放在能將大量記憶體(SRAM)直接整合於晶片本體的設計。將昂貴的 SRAM 儘可能塞進單一晶片,可在處理大量使用者請求時,為聊天機器人與 AI 系統帶來顯著速度優勢。
知情人士透露,為此,OpenAI 曾與 Cerebras、Groq 等新創公司討論合作,以取得更快的推論晶片。而當 OpenAI 明確表達對輝達技術的疑慮後,輝達也積極接觸多家專注於 SRAM 架構的公司,包括 Cerebras 與 Groq,洽談潛在收購。
輝達隨後與 Groq 簽署了一筆高達 200 億美元的技術授權協議,迫使 OpenAI 中止相關談判。多位晶片業高層認為,輝達快速拿下 Groq,是為了在快速變化的 AI 與半導體市場中,強化自身技術布局。Cerebras 最終選擇與 OpenAI 達成商業合作。
去年 9 月,輝達曾表示,計劃對 OpenAI 投資高達 1,000 億美元,以換取該新創公司的股份,並為 OpenAI 提供資金以採購先進晶片。該交易原預期數週內完成,談判卻已延宕數月。
雙方各有心思,檯面下暗潮洶湧,但至少表面上,仍是一派和樂融融。
黃仁勳 1 月 31 日在台北舉辦供應鏈兆元宴後,淡化外界關於雙方關係緊張的報導,將相關說法斥為無稽,並重申輝達仍將對 OpenAI 進行大規模投資。公司亦在聲明中表示,客戶持續選擇 Nvidia作為推論平台,「因為我們能在大規模部署下提供最佳效能與總持有成本。」
OpenAI 發言人則指出,公司目前仍高度依賴輝達來支撐其大部分推論運算,且輝達在推論效能與成本表現上仍是最佳選擇。OpenAI 執行長奧特曼(Sam Altman)也在社群平台 X 發文表示,輝達生產的是「全球最好的 AI 晶片」,並稱 OpenAI 希望在未來很長一段時間內,仍能成為輝達的「超級大客戶」。
在推論成為 AI 下一個主戰場之際,這段表面穩固的合作關係,未來仍面臨現實考驗。




