近期市場關(guān)注NVIDIA (英偉達(dá))GB200整柜式方案(Rack)各項(xiàng)供應(yīng)進(jìn)度,由于GB200 Rack在高速互通界面、熱設(shè)計(jì)功耗(TDP)等設(shè)計(jì)規(guī)格皆明顯高于市場主流,供應(yīng)鏈業(yè)者需要更多時(shí)間持續(xù)調(diào)校、優(yōu)化,預(yù)期最快將于2025年第二季后才有機(jī)會放量。
NVIDIA GB Rack方案(包括GB200、GB300等)因?qū)爰夹g(shù)層次更復(fù)雜、高成本等特性,主要客戶將為大型云服務(wù)提供商(CSP),以及Tier-2數(shù)據(jù)中心、國家主權(quán)云和學(xué)術(shù)研究單位等HPC/AI應(yīng)用項(xiàng)目。在NVIDIA大力推動(dòng)下,預(yù)期GB200 NVL72機(jī)柜將于2025年成為主要的采用方案,占比可望接近80%。
TrendForce集邦咨詢表示,為提升AI/HPC Server系統(tǒng)整體運(yùn)算效能,NVIDIA開發(fā)NVLink以提供GPU芯片之間的高速互連技術(shù),如GB200采用第五代NVLink,總頻寬大幅優(yōu)于目前市場主流PCIe 5.0。此外,2024年主導(dǎo)市場的HGX AI Server每柜TDP動(dòng)輒達(dá)60 KW至80 KW,而GB200 NVL72每柜則達(dá)到140 KW,TDP再度提升一倍,為此業(yè)者嘗試擴(kuò)大采用液冷散熱解決方案。
由于GB200 Rack系統(tǒng)采用更高設(shè)計(jì)規(guī)格,市場頻傳可能因部分零部件未達(dá)要求,有延遲出貨風(fēng)險(xiǎn)。根據(jù)TrendForce集邦咨詢調(diào)查,目前Blackwell GPU芯片出貨情形大致如原先預(yù)期,2024年第四季僅少量出貨,2025年第一季后逐季放量。在AI Server系統(tǒng)方面,因尚待供應(yīng)鏈各環(huán)節(jié)持續(xù)調(diào)整,至今年底的出貨量恐低于業(yè)者預(yù)期,據(jù)此,2025年GB200整機(jī)柜的出貨高峰將略有延后。
傳統(tǒng)氣冷散熱解決方案已無法應(yīng)對GB200 NVL72的TDP值,液冷技術(shù)成為其必需。隨著GB200 Rack方案于2024年底開始小量出貨,相關(guān)業(yè)者也加大液冷散熱零部件研發(fā)能量,如冷卻分配系統(tǒng)(CDU)供應(yīng)商正透過擴(kuò)大機(jī)柜尺寸和采用更高效的冷卻板(Cold Plate)提高散熱效能。TrendForce集邦咨詢表示,目前Sidecar CDU的散熱能力主要集中于60 KW至80 KW,未來可望達(dá)成雙倍甚至逾三倍的散熱表現(xiàn)。至于更高效的液對液(L2L)型in-row CDU方案,散熱能力已能超過1.3MW,未來也將繼續(xù)提升,以應(yīng)對算力增長需求。