中國新創人工智慧公司深度求索(DeepSeek)號稱以較少資源創造了表現不亞於 ChatGPT 的 AI 模型 V3 及 R1,猶如深水炸彈,震驚科技業。當各界猶自懷疑這些年來的投資是否錯付時,美國公司 OpenAI 指控,自家模型遭到 DeepSeek 盜用,證據確鑿。
金融時報報導,ChatGPT 開發商 OpenAI 指證歷歷,稱在 DeepSeek 身上發現了的「蒸餾」(distillation)痕跡。蒸餾技術指的是,開發者將大型模型的產出用來訓練小型模組,使之表現更佳,以低廉成本取得類似成果。這在業界不是秘密,但若 DeepSeek 確是用 OpenAI 來打造模型,就有違規侵權之虞。
OpenAI 與夥伴微軟(Microsoft)去年就發現,疑為 DeepSeek 帳號不當使用 OpenAI 的應用程式介面(API)的情況,因而阻擋了此種違反規定的蒸餾行徑。目前調查仍在進行。
深度求索宣稱,其僅花了 560 萬美元,用了 2,048 個輝達(Nvidia)H800 晶片,就訓練出 V3 模型(具 6,710 億參數)。相較於 OpenAI 及 Google 在訓練相似模型的巨額投資,可謂杯水車薪。部分專家表示,從 V3 生成的答案可見,的確有 GPT-4 的影子。
業界人士透露,中國、美國的 AI 實驗室都會將 OpenAI 這類公司的產出結果納為己用,訓練自家模型。畢竟這可是花了大把銀子雇用真人訓練,答案更為擬真,卻費力費工,被新創公司或學者拿來應用,是再自然不過的事。
此事也凸顯了,科技業想要保護智慧財產權、捍衛優勢的不易。不過,先不提模型遭盜用,OpenAI 自身其實也正面臨紐約時報等媒體與知名作家對內容竊用的侵權指控,官司還有得打。