NVIDIA 的 GB200 整櫃式方案(rack)近期成為市場關注焦點,TrendForce 的最新調查指出,由於 GB200 Rack 的高速互通介面、熱設計功耗(TDP)等設計規格明顯高於市場主流,供應鏈業者需要更多時間進行調校與最佳化,預計最快要到 2025 年第二季後才有機會放量。

NVIDIA 的 GB200 整櫃式方案(rack)近期成為市場關注焦點,TrendForce 的最新調查指出,由於 GB200 Rack 的高速互通介面、熱設計功耗(TDP)等設計規格明顯高於市場主流,供應鏈業者需要更多時間進行調校與最佳化,預計最快要到 2025 年第二季後才有機會放量。

NVIDIA 的 GB Rack 方案(包括 GB200、GB300 等)由於技術層次更複雜且成本較高,主要目標客群將是大型雲端服務提供商(CSP),其他如 Tier-2 資料中心、國家主權雲及學研單位等 HPC/AI 應用專案也將是其潛在客戶。在 NVIDIA 的大力推動下,GB200 NVL72 機櫃預計將在 2025 年成為主要採用方案,市場占比可望接近 80%。

為提升 AI/HPC 伺服器系統的整體運算效能,NVIDIA 開發了 NVLink 技術,提供 GPU 晶片高速互連。例如,GB200 採用了第五代 NVLink,其總頻寬大幅優於市場主流的 PCIe 5.0。今年主導市場的 HGX AI 伺服器每櫃的 TDP 動輒達到 60KW~80KW,而 GB200 NVL72 每櫃的 TDP 更達到 140KW,TDP 提升了一倍,因此業者正嘗試擴大採用液冷散熱解決方案。

由於 GB200 Rack 系統的更高規格,市場頻傳部分零組件可能未達要求,導致出貨遞延的風險。TrendForce 調查顯示,Blackwell GPU 晶片的出貨情形大致如預期,第四季僅少量出貨,2025 年第一季後將逐季放量。然而,AI 伺服器系統方面,由於供應鏈各環節尚需持續調整,今年底的出貨量可能低於業者預期,2025 年 GB200 整機櫃的出貨高峰將略為延後。

傳統的氣冷散熱解決方案已無法應對 GB200 NVL72 的高 TDP 值,液冷技術成為必須。隨著 GB200 Rack 方案於 2024 年底開始小量出貨,相關業者也加大了液冷散熱零組件的研發能量,例如冷卻分配系統(CDU)供應商擴大機櫃尺寸,並採用更高效的冷卻板(Cold Plate)以提高散熱效能。TrendForce 指出,目前 Sidecar CDU 的散熱能力主要集中在 60KW~80KW,未來可望達到雙倍甚至三倍的散熱表現。至於更高效的液對液(L2L)型 in-row CDU 方案,散熱力已超過 1.3MW,未來也將繼續提升以因應算力增長的需求。

總結來看,NVIDIA 的 GB200 Rack 方案將在 2025 年成為 AI/HPC 伺服器市場的主流,但其高規格的設計與散熱需求將帶動液冷技術的進一步發展,並推動供應鏈在散熱解決方案上的創新與升級。

Leave a Comment