中國 AI 新創公司深度求索(DeepSeek)原定 5 月發布的 R2 模型因技術問題推遲,英國金融時報揭露,主因是採用華為(Huawei)昇騰(Ascend)晶片訓練時遭遇瓶頸,最終被迫混合使用輝達(Nvidia)H20 晶片訓練、華為晶片推理。
關鍵問題
訓練受挫:華為派工程師進駐協助,仍無法解決昇騰晶片在模型訓練階段的穩定性與連接速度問題。
H20 限制:中國政府要求企業說明採購輝達 H20 理由,但國產替代方案效能仍落後 20-30%。
市場衝擊:延遲發布讓深度求索落後競爭對手,阿里(Alibaba)通義千問(Qwen3)等模型已搶佔市場;另有知情人士指出,數據標註耗時超過預期,也是延遲的重要原因。
地緣技術角力
輝達以 H20 在中國銷售分潤換取出口許可。加州大學柏克萊分校 AI 研究員 Ritwik Gupta 分析:「這屬於技術迭代的陣痛期。輝達 H20 目前仍是中國企業最穩定的選擇。」輝達則聲明,限制晶片出口「將傷害美國開發者生態系利益」。
據悉,深度求索創辦人梁文鋒已要求團隊加碼研發,目標推出「能維持技術領先的下一代模型」。據中國媒體預測,R2 模型可能於數週內發布。





