科幻電影中,不可能存在的場景,隨著AI發展,將搬到我們日常生活,大幅改變人類世界。但資料中心熱量快速飆升,如何「散熱」成為影響AI成敗的關鍵,投資人可順藤摸瓜,找尋投資機會。
資料中心耗能龐大
輝達執行長黃仁勳最近在財報會議中,特別點名台灣六大協力廠商,共同協助解決Blackwell 產品過熱的問題,包括台積電、鴻海、廣達、緯穎、日月光、京元電。顯示先進封裝外包,在協力廠商共同努力下,已再度順利解決,未來伺服器等各種設備,將可依計劃出貨,達到預定目標。
散熱方式
過去資料中心伺服器降溫,一直是依賴最傳統的風扇吹掉熱氣,但是目前全球資料中心用電量已高達350 TWH(大瓦時),比台灣2023年全年用電量270 TWH還多。預計到2034年,用電量將達1580 TWH,傳統風扇降溫已不敷使用。
目前資料中心伺服器散熱方式,包括氣冷、液冷、浸沒式等,氣冷是用風扇、鰭片、導熱管,置放在合適的位置。缺點是機房噪音、空間佔用,再加上灰麈易揚升,越來越不足以因應新科技的需要。優點是成本低廉,裝置容易。液冷分為「水對氣」、「水對水」兩種,水對氣目前資料中心有6成採用,能降低空間使用率以及機房噪音。
水對水是將裝滿冷卻液的密封管線,環繞在伺服器內最容易發熱的關鍵零組件附近,零組件透過導熱銅片,將熱能傳導到冷卻液,再透過冷卻管線,進行冷熱液體的交換循環,效果不錯,但是常常故障,修不勝修。
浸沒式散熱是未來主流
浸沒式散熱應該才是AI資料中心未來最大的期待。顧名思義就是將整台伺服器整組浸沒,置放進不導電的液體當中。不只解決晶片的熱,連同CPU、記憶體等各種伺服器的電子設備,同時可以進行散熱,應是資料中心散熱未來發展最受期待的目標。但浸沒式散熱衍生的問題,是現有機房需要重新規劃,成本不低,以及冷卻液的污染疑慮。
伺服器B200、GB200等產品,HGX型號一組就有8塊GPU,NVL型號,每個機櫃又有36至72塊GPU。目前資料中心冷卻方式常使用風冷、液冷併用,勉強達到散熱目的。但NVL功率大增,就必須改變冷卻方式,否則整組伺服器將面臨高溫停擺的威脅。
黃仁勳催生散熱改革
輝達坦承正與供應商研究浸沒式冷卻技術,優點是可能使用電量減少4成至5成,對AI未來的發展,至關重要。鴻海、廣達2大廠已在2024年底,小量生產GB 200伺服器,2025年將放量增產,散熱難題亟待解決。浸沒式散熱技術的挑戰包括:模組化、標準化尚未建立,驗證複雜、漏夜問題常發生,有待克服。
今年7月曾發生輝達GB200液冷零組件機櫃漏水,散熱系統出問題,危險的是即使一滴水不當落在伺服器上,都將使數百萬美元的GB200發生災難性的損害,當時曾引起輝達及供應商的恐慌。
11月外媒The Information 報導指出,輝達Blackwell晶片安裝GB200 AI伺服器不當,導致機架嚴重過熱問題。消息曝光,鴻海、廣達、緯創股價應聲下挫2%,並紛紛發表重大訊息,強調GB200機櫃出貨不會延期,藉此解決市場的疑慮,但不願證實消息的真偽。
散熱商機大
全球AI伺服器正快速發展中,算力愈強大,散熱需求也愈大。全球7成散熱產業在台灣,散熱品質的良窳,不止影響伺服器耗電量、壽命、生產成本,更直接關係到AI產業未來發展的成敗。
當前台灣積極發展散熱科技的上市櫃公司包括:奇鋐、雙鴻、台達電、晟銘電、邁科、高力、建準、尼德科超眾、英業達等,各擁不同散熱技術,但是卻又面臨不同的瓶頸,顯見散熱科技仍未臻成熟。也正因如此,散熱市場,值得投資人密切注意未來發展,商機龐大,但須重視價格是否已漲高,小心風險。
★投資有風險 • 理財請慎思★