傳統風冷技術以空氣為冷卻介質,成本較低,適合小規模的數據中心。而液冷技術以液體為介質進行熱交換,散熱介質比熱容更大,制冷量大,制冷效率高,更適用于大規模、高密度、高功耗的數據中心。
隨著AI技術的迅猛發展,數據中心對于算力的需求越來越高。據中國信通院數據顯示,截至2024年6月,我國在用算力中心超過830萬標準機架,算力規模達到246EFLOPS(FP32),智算同比增速超過65%。在如此高算力的需求下,數據中心的整機密度也在不斷提高。
近年來,CPU與GPU的單卡功率和服務器的整機功率密度不斷提高,數據中心的散熱問題成為擺在用戶面前最大的挑戰。如何降低數據中心的整體能耗,符合國家節能減排政策的要求,成為數據中心運營者不得不重點考慮的問題。為此,采用更加高效的液冷散熱技術替代傳統的風冷技術,成為未來數據中心的主要發展趨勢。

數據中心散熱方式的變革
傳統風冷技術以空氣為冷卻介質,成本較低,適合小規模的數據中心。而液冷技術以液體為介質進行熱交換,散熱介質比熱容更大,制冷量大,制冷效率高,更適用于大規模、高密度、高功耗的數據中心。
在AI算力需求的強力驅動下,數據中心GPU服務器的數量大幅增加,所帶來的功耗問題日益凸顯。我們知道,數據中心單機柜風冷的極限總功率通常被認為在15kW左右。這一數值是基于當前風冷技術的散熱能力和數據中心的運行需求所得出的。當機柜的功率密度超過這一極限時,風冷系統的散熱效率將大幅下降,無法滿足數據中心的制冷需求。
那么,在機柜上架率不變的情況下,GPU服務器所帶來的功率增長已經逼近單機柜的極限值。然而,GPU的功耗還在不斷地增長。以英偉達發布的GB200旗艦級GPU為例,這款產品包括兩個GPU內核,每個內核功耗約為1200W,同時還擁有兩個Arm CPU,功耗在300W左右,那么僅僅這個產品的總功耗就達到了恐怖的2700W左右。不難發現,面對高功耗高密度場景,傳統的風冷顯然已經無法滿足能耗和散熱需求,液冷技術以超高能效、超高熱密度等特點,成為智算中心散熱解決方案的必選項。
除了技術層面之外,政策層面對于節能減排的緊迫性同樣推動了液冷市場的快速發展。《信息通信行業綠色低碳發展行動計劃(2022-2025年)》明確要求,到2025年,新建大型數據中心的電能利用效率需降至1.3以下,這一標準促使數據中心運營商重新審視和改進其散熱技術和基礎設施。
根據IDC的預測,2022-2027年,中國液冷服務器市場年復合增長率將達到54.7%,2027年市場規模將達到89億美元。中國信通院數據顯示,在產業鏈各方的推動下,中國液冷數據中心市場快速發展。過去幾年保持40%的復合增長率。2022年,液冷應用爆發,市場規模達到100.5億元。預計在人工智能等新技術普及應用帶動下,至2027年,中國液冷數據中心市場規模將突破千億大關。
服務器廠商紛紛入局,加速推動液冷技術發展
在未來的競爭中,企業間的科技創新與產品迭代將成為決定其市場地位的關鍵因素。隨著液冷技術的發展,聯想、浪潮、戴爾、曙光、超聚變和新華三等服務器廠商紛紛入局,加速在液冷散熱技術方面的研發與生產。
1)聯想
聯想在液冷技術領域有著深厚的積累,其自主研發的聯想海神液冷技術已經演進到第六代,匯集了材料學等多學科的科研結晶。聯想海神液冷技術通過全冷板設計,實現了高效散熱且支持大規模擴展。此外,聯想問天海神液冷解決方案實現了對CPU及電源等關鍵部件100%全覆蓋液冷散熱設計,散熱系統機械故障率接近于0。目前,聯想問天海神液冷方案在全球部署已經超過7萬套,廣泛應用于高校、科研機構、政企等領域。
2)浪潮
浪潮信息在液冷技術領域也有所突破,并與英特爾共同發布了《全液冷冷板系統參考設計及驗證白皮書》,這也是全球首個針對液冷冷板服務器的參考設計方案。浪潮信息的液冷技術不僅涉及當前行業普遍探索的CPU和GPU液冷方案,還在系統層面上達到了接近100%的液冷熱捕獲效率。
3)戴爾
戴爾科技提供了多樣化液冷方案,以滿足用戶需求。其PowerEdge C6420服務器提供了間接液冷選項,以閉環水流取代典型的金屬散熱器。此外,戴爾還與TMGcore公司合作,推出了高密度、GPU優化的戴爾易安信C4140服務器在沉浸式環境中運行的解決方案,該方案的處理能力比傳統數據中心高35%。
4)超聚變
超聚變以其全液冷整機柜GPU服務器FusionPoD for AI,在提升算力密度和能效方面取得了重大進展。該液冷服務器采用開放架構,專為多樣化算力需求設計,可以支持不同類型的GPU模塊和顯卡的快速適配,迅速實現液冷散熱,大幅提升算力密度。目前,超聚變已成功交付超七萬臺液冷節點。
5)新華三
新華三發布的H3C UniServer G7系列服務器采用了ALL in GREEN全棧液冷技術,實現了極致液冷和高密度計算。該技術采用100%液冷和睿流技術,降低整機能耗;同時,兩相液冷及冷凝回流設計使散熱效率大幅提升,實現綠色節能。此外,新華三還通過箱式浸沒和油類浸沒技術實現零碳引擎。
6)寧暢
寧暢在液冷散熱技術方面實現了從服務器到機柜,再到智算中心等多形態的液冷選擇,覆蓋了CPU、內存、硬盤、GPU、各種形態PCIe設備以及PSU等服務器內全部散熱單元。由于采用原生全液冷技術,寧暢不僅實現了液冷成本可控,運維方式與風冷無異,而且數據中心運行PUE值可低至1.09,實現了數據中心能效極致,最大限度釋放冷空調電力加速算力提升。
可以看出,聯想、浪潮、戴爾、曙光、超聚變、新華三和寧暢等服務器廠商在液冷散熱技術方面均有著顯著的優勢和特色。這些廠商通過不斷創新和研發,推動了液冷技術的快速發展和應用普及。
液冷技術在未來普及過程中主要面臨的挑戰
作為一種新型的冷卻方式,液冷技術在服務器機柜領域的應用前景廣闊,但同時也面臨著多方面的挑戰。
一是產品標準化問題:液冷技術涉及多個層面,包括液冷數據中心系統架構層、液冷部件及接口層、液冷基礎設施層等,各企業技術路徑多種多樣,產品規格千差萬別,導致標準化適配和部署的難度很大。推進液冷技術的標準化進程,提升標準部件的行業用量,是降低整體方案成本的關鍵。
二是方案可靠性問題:首先,單相冷板方案需要進一步提升工藝和部件的可靠性,降低泄漏風險,并配合漏液檢測等方式提升系統可靠性。其次,浸沒液冷方案需要解決冷卻液的長期兼容性問題,以及CDU等配套設備的運行可靠性問題。
三是成本問題:一是液冷數據中心的初期建設成本比風冷數據中心高出約10%,需要1年左右的時間才可實現擁有成本與投資回報的平衡。二是浸沒式液冷方案使用的冷卻液,如氟化液,價格昂貴,且存在環保法規風險。油類冷卻液雖然成本較低,但散熱能力相對較差,且設備維護更為復雜。
四是環保問題:兩相浸沒冷卻技術中使用的某些化學成分可能具有毒性,如PFAS(全氟和多氟烷基物質),難以自然分解;另外,一些用于浸沒冷卻的液體可能具有較強的腐蝕性,會腐蝕電子設備中的金屬部件。
可以說,液冷技術雖然具有高效散熱和節能的優勢,但在實際應用中仍面臨多方面的挑戰。因此,為了推動液冷技術的進一步發展,需要不斷提升技術可靠性、推進標準化進程、降低建設成本、優化運維管理以及加強安全與環保措施。
作者:張誠
標簽: 液冷、數據中心等 點擊: 評論: