中國人工智慧(AI)新創公司DeepSeek才成立一年多,但近期接連推出號稱低成本、效能能媲美OpenAI的AI模型,並成為App Store上評分最高的免費應用程式,不僅震盪矽谷科技業,連帶造成美國主要指數大跌,輝達(NVIDIA)下跌 16.97%,市值蒸發約 5890 億美元。
DeepSeek於去年 12 月 26 日、今年 1 月 20 日先後推出「DeepSeek-V3」和「DeepSeek-R1」兩款AI模型。據該官網上表示,「DeepSeek-V3」的多項評測成績超越了 Qwen2.5-72B 和 Llama-3.1-405B 等其他開源模型,並在效能上和世界頂尖的閉源模型 GPT-4o 以及 Claude-3.5-Sonnet 不分伯仲。「DeepSeek-R1」則是在數學、程式碼、自然語言推理等任務上,效能與OpenAI o1 正式版並駕齊驅。
1月28日又再推出兩款開源多模態AI 模型「Janus-Pro」、「JanusFlow」,其中 Janus-Pro-7B 在 GenEval 和 DPG-Bench 基準測試中優於 OpenAI 的 DALL-E 3 和 Stable Diffusion。
據外媒報導,分析師指出,DeepSeek-R1訓練成本估計僅 600 萬美元、使用2048組Nvidia H800晶片,並在兩個月內成功開發,而這種晶片在 2023 年 10 月前尚被美國政府允許出口至中國。
相比之下,高盛預測,未來幾年內,OpenAI、Google 及其他美國主要公司在人工智慧領域的總投資將接近 1 兆美元。也因此,若所言為真,不僅讓人開始質疑美國AI產業動則投入數千億美元資本巨額真的是最有效之方法?
因為中國AI黑馬DeepSeek崛起,美國主要指數週一(1/27)慘遭血洗,道瓊工業指數上漲 289.33 點或 0.65%,收44713.58 點;標準普爾指數下挫 88.96 點,或 1.46%,收6012.28點;那斯達克指數大跌 612.46 點,或 3.07%,收19341.84 點。;費城半導體指數暴跌 488.70 點或 9.15%,收 4853.24 點。
而根據輝達最新聲明指出,DeepSeek的進步,代表了輝達晶片對於中國市場的可用性,未來,DeepSeek會需要更多輝達晶片來滿足的需求。輝達在聲明中也提到,透過DeepSeek的成果說明了如何使用該技術、利用廣泛可用的模型建立新模型,且未違反美國政府限制獲取先進晶片的規定。
DeepSeek 於 2023 年 7 月在中國杭州成立,創辦人為 1985 年出生的梁文峰,他亦是杭州雅克比投資管理有限公司、程式交易對沖基金幻方量化(High-Flyer)的共同創辦人,致力於透過人工智慧進行量化投資。