數(shù)據(jù)中心對液冷的需求正在快速演變,廠商也在積極應(yīng)對。
▌Nvidia 的高功耗 AI 芯片推動液冷技術(shù)前進
Nvidia 最新的 H100 芯片在 SXM 插座上運行時功耗高達 700 瓦,而在 PCI-E 配置下功耗仍然高達 400 瓦。因此,2024 年成為數(shù)據(jù)中心行業(yè)普遍關(guān)注液冷技術(shù)的一年,也就不足為奇。
AI 的爆炸式增長迫使數(shù)據(jù)中心運營商跳出傳統(tǒng)的空氣冷卻方案,尋找更加高效的冷卻方式,以保持 IT 系統(tǒng)的高效運行。

▌液冷解決方案迎來突破性發(fā)展
在 AI 計算需求激增的背景下,數(shù)據(jù)中心業(yè)主和運營商不得不為全新的綠色數(shù)據(jù)中心設(shè)計液冷系統(tǒng),同時還要考慮現(xiàn)有數(shù)據(jù)中心的改造和升級。
目前,這些計算負(fù)載的需求似乎仍在不斷增長,無論是在功耗、冷卻、帶寬 還是數(shù)據(jù)存儲方面。例如,Nvidia 即將推出的 Blackwell 系列 GPU 進一步提升了功耗需求:
?B200 GPU 的功耗預(yù)計可達 1,200W
?GB200(由兩個 B200 GPU 及 Grace CPU 組成)甚至可能達到 2,700W
這一變化意味著,單一GPU代際功耗增長高達 300%,充分反映了 AI 計算系統(tǒng)不斷攀升的能源需求。
▌液冷市場增長迅猛,預(yù)計 2028 年將達 168 億美元
液冷市場正在迎來高速發(fā)展,分析機構(gòu)預(yù)計 數(shù)據(jù)中心冷卻市場將在 2028 年達到 168 億美元,年均復(fù)合增長率(CAGR)高達 25%,其中液冷技術(shù)是最大推動力。
隨著 AI 計算負(fù)載的不斷擴大,超高密度 AI 機柜正逐漸成為現(xiàn)實。這些機柜的功耗可高達100kW,其內(nèi)部設(shè)備價值可能超過 1,000 萬美元/機柜,通常依賴于直觸式液冷或浸沒式液冷。這種轉(zhuǎn)變帶來了供電、空間和冷卻等方面的嚴(yán)峻挑戰(zhàn),以適應(yīng)前所未有的計算負(fù)載。
在確定 AI 計算冷卻策略之前,業(yè)主和運營商必須評估廣泛的工程因素,不僅要考慮供應(yīng)鏈限制,還要兼顧長期的企業(yè) ESG(環(huán)境、社會、治理)和可持續(xù)發(fā)展目標(biāo)。
▌直觸式液冷 vs. 浸沒式液冷:誰將主導(dǎo)市場?
在眾多液冷解決方案中,冷板技術(shù)和直觸式液冷似乎最受歡迎。
?直觸式液冷,特別是冷板液冷,因其在高密度計算環(huán)境中的高效性及與現(xiàn)有數(shù)據(jù)中心基礎(chǔ)設(shè)施的兼容性,成為最常見的選擇。
?對于新建數(shù)據(jù)中心,浸沒式液冷部署可能會增加,采用單相或兩相冷卻技術(shù)。
▌廠商推動液冷技術(shù)創(chuàng)新
自 2022 年底以來,液冷廠商一直在努力平衡創(chuàng)新與風(fēng)險管理,并推出了新方案,一些方案甚至模糊了直觸式液冷與浸沒式液冷的界限。
1. Accelsius NeuCool 兩相直觸式液冷
2024 年 4 月,Accelsius 推出了 NeuCool 兩相直觸式液冷解決方案,其工作原理如下:
?采用介電制冷劑,在吸收高功率 CPU/GPU 的熱量時蒸發(fā),形成冷卻循環(huán)。
?蒸汽隨后被冷凝并重新循環(huán),從而形成高效冷卻回路。
?該系統(tǒng)可支持單個插座高達 2,200W,并能為 100kW 機柜 提供冷卻。
?還能用于老舊空氣冷卻設(shè)備的升級,其專利 CPU/GPU “蒸發(fā)器”可直接替代傳統(tǒng)散熱器,無需更改設(shè)備結(jié)構(gòu)。
?可選水冷或無水冷設(shè)計,具有模塊化結(jié)構(gòu),適用于邊緣計算到超大規(guī)模數(shù)據(jù)中心的不同需求。
2. Chilldyne 直觸式液冷:真空防泄漏技術(shù)
Chilldyne 推出了一個創(chuàng)新性的直觸式液冷方案,可有效防止泄漏。
?該系統(tǒng)通過真空吸力使冷卻液在 CPU/GPU冷板之間流動。
?如果冷卻管破裂,真空系統(tǒng)會防止液體泄漏,并自動吸入空氣,確保冷卻液不會外溢。
?該系統(tǒng)持續(xù)監(jiān)測壓力變化,一旦發(fā)生異常會向運營商發(fā)出警報。
?在某些配置下,該系統(tǒng)可以隔離受影響區(qū)域,以最小化對其他組件的影響。
?2024 年 7 月,Chilldyne 進一步推出了即插即用(Plug-and-Play)液冷入門套件,支持 150kW 機柜冷卻,為數(shù)據(jù)中心現(xiàn)代化改造提供便捷解決方案。

3. Asperitas、LiquidStack、Submer:押注浸沒式液冷
一些廠商則將目光投向新建數(shù)據(jù)中心,如 Asperitas、LiquidStack 和 Submer,他們專注于浸沒式液冷 方案。
?浸沒式液冷采用單相或兩相技術(shù),即將服務(wù)器完全浸入介電液體,通過液體高效傳熱將熱量帶走。
?優(yōu)點:冷卻效率極高,適用于超高密度計算負(fù)載。
?挑戰(zhàn):需要重新設(shè)計數(shù)據(jù)中心架構(gòu),與現(xiàn)有空氣冷卻系統(tǒng)兼容性較低。

▌液冷普及的挑戰(zhàn)
盡管液冷具有長遠(yuǎn)的節(jié)能優(yōu)勢,但它仍面臨幾個主要阻礙因素:
1.前期投資高:無論是改造舊數(shù)據(jù)中心還是新建數(shù)據(jù)中心,液冷方案的設(shè)備投入成本較大。
2.低密度數(shù)據(jù)中心難以推廣:對 AI 或 HPC 需求不高 的數(shù)據(jù)中心,仍然可以依賴空氣冷卻,無需升級液冷系統(tǒng)。
3.缺乏標(biāo)準(zhǔn)化:液冷系統(tǒng)的管路、分配單元(CDU)、儲液罐等組件不同廠商間缺乏統(tǒng)一標(biāo)準(zhǔn),導(dǎo)致兼容性問題。
4.監(jiān)管與可持續(xù)性壓力:某些冷卻液對環(huán)境影響較大,需要特殊處理和回收,增加了企業(yè)的運營成本。
▌未來展望:液冷市場仍有巨大增長空間
盡管面臨挑戰(zhàn),液冷市場仍然擁有廣闊的增長潛力。隨著行業(yè)標(biāo)準(zhǔn)化推進,以及廠商不斷創(chuàng)新以降低風(fēng)險,液冷的應(yīng)用范圍將進一步擴大。
畢竟,物理定律不會改變:每增加 1W 功率,就需要移除 1W 熱量。

標(biāo)簽: 液冷、數(shù)據(jù)中心等 點擊: 評論: