Supermicro的SuperCluster配備了NVIDIA HGXTM B200 8-GPU、NVIDIA GB200、NVL4和NVL72系統(tǒng),提供升級(jí)的AI計(jì)算密度
Supermicro, Inc. (NASDAQ:SMCI)為AI、云端、存儲(chǔ)和5G/邊緣領(lǐng)域的全方位IT解決方案提供企業(yè),宣布推出高性能的SuperCluster。這一端對(duì)端AI數(shù)據(jù)中心解決方案采用NVIDIA Blackwell平臺(tái),專為兆級(jí)參數(shù)規(guī)模的生成式AI時(shí)代所設(shè)計(jì)。全新SuperCluster將可大幅增加液冷機(jī)架中的NVIDIA HGX B200 8-GPU系統(tǒng)數(shù)量,與Supermicro目前領(lǐng)先業(yè)界的搭載NVIDIA HGX H100和H200的液冷型SuperCluster相比,GPU計(jì)算密度得到大幅提升。此外,Supermicro正在擴(kuò)大其NVIDIA Hopper系統(tǒng)產(chǎn)品組合,以應(yīng)對(duì)加速型HPC應(yīng)用和主流企業(yè)級(jí)AI技術(shù)的快速普及。
Supermicro總裁兼首席執(zhí)行官梁見后(Charles Liang)表示:“Supermicro 擁有必要的專業(yè)技術(shù)、交付速度和產(chǎn)能,有能力部署包含100,000個(gè)GPU的全球最大液冷AI 數(shù)據(jù)中心項(xiàng)目,而通過Supermicro與NVIDIA的協(xié)作,該項(xiàng)目最近剛完成部署。這些Supermicro SuperCluster能通過高效直接液冷(DLC)技術(shù)降低電力需求。同時(shí),我們現(xiàn)在推出了采用NVIDIA Blackwell平臺(tái)的解決方案。通過建構(gòu)組件(Building Block)技術(shù),能快速設(shè)計(jì)搭載NVIDIA HGX B200 8-GPU的服務(wù)器,并自由搭配液冷或氣冷散熱配置。我們的SuperCluster提供空前的密度、性能和效率,為未來更密集的AI計(jì)算解決方案奠定基礎(chǔ)。Supermicro的計(jì)算集群搭配直接液冷技術(shù),可幫助整個(gè)數(shù)據(jù)中心實(shí)現(xiàn)更高的性能和更低的功耗,并降低運(yùn)營(yíng)成本?!?/p>
經(jīng)驗(yàn)證的大規(guī)模AI性能:Supermicro NVIDIA HGX B200系統(tǒng)
升級(jí)后的SuperCluster可擴(kuò)充單元采用機(jī)架級(jí)設(shè)計(jì),具有創(chuàng)新垂直冷卻液分配歧管(CDM),可使單一機(jī)架內(nèi)的計(jì)算節(jié)點(diǎn)數(shù)量增加。新開發(fā)的高效散熱冷板和先進(jìn)的軟管設(shè)計(jì)可進(jìn)一步改善液冷系統(tǒng)效率。適合大型部署的新型In-Row式冷卻液分配裝置(CDU)亦可被納入計(jì)算集群的散熱配置內(nèi)。傳統(tǒng)氣冷數(shù)據(jù)中心也能運(yùn)用搭配新型氣冷系統(tǒng)機(jī)箱的全新NVIDIA HGX B200 8-GPU系統(tǒng)。
全新Supermicro NVIDIA HGX B200 8-GPU系統(tǒng)相較于前一代,提供了多項(xiàng)升級(jí)。這些新系統(tǒng)包含對(duì)散熱和電源方案的優(yōu)化,并支持雙500W Intel? Xeon? 6(配備DDR5 MRDIMM,傳輸速度達(dá)8800 MT/s)或AMD EPYCTM 9005系列處理器。而全新氣冷式10U機(jī)型Supermicro NVIDIA HGX B200系統(tǒng)則采用經(jīng)重新設(shè)計(jì)的機(jī)箱,具有更佳的散熱空間以支持8 個(gè)1000W TDP Blackwell GPU。這些系統(tǒng)在GPU搭配NIP的架構(gòu)上采用1:1比例設(shè)計(jì),并支持NVIDIA BlueField?-3 SuperNIC或NVIDIA ConnectX?-7 NIC,可在高性能計(jì)算結(jié)構(gòu)內(nèi)進(jìn)行擴(kuò)充。此外,每個(gè)系統(tǒng)所配備的兩個(gè)NVIDIA BlueField-3數(shù)據(jù)處理器(DPU),能使附加型高性能AI存儲(chǔ)裝置之間的數(shù)據(jù)傳輸處理效率得到提升。
采用NVIDIA GB200 Grace Blackwell超級(jí)芯片的Supermicro解決方案
Supermicro亦提供搭配所有NVIDIA GB200 Grace Blackwell超級(jí)芯片的解決方案,包括最新發(fā)布的NVIDIA GB200 NVL4超級(jí)芯片和NVIDIA GB200 NVL72單機(jī)架百萬兆級(jí)計(jì)算機(jī)。
Supermicro的NVIDIA MGX系列設(shè)計(jì)將支持NVIDIA GB200 Grace Blackwell NVL4 超級(jí)芯片。這款超級(jí)芯片啟動(dòng)了融合式高性能計(jì)算與AI的未來,并通過NVLink-C2C技術(shù),以及四個(gè)由NVIDIA NVLink? 連接的Blackwell GPU與兩個(gè)NVIDIA Grace? CPU,提供了革命性的性能。這些超級(jí)芯片與Supermicro的液冷型NVIDIA MGX模塊化系統(tǒng)兼容,且相較于上一代產(chǎn)品,能為科學(xué)計(jì)算、圖神經(jīng)網(wǎng)絡(luò)(GNN)訓(xùn)練和推理應(yīng)用提供至高兩倍的性能。
搭配Supermicro端對(duì)端液冷解決方案的NVIDIA GB200 NVL72 SuperCluster能在具有SuperCloud Composer(SCC)軟件的單個(gè)機(jī)架中組成一個(gè)百萬兆級(jí)超級(jí)計(jì)算機(jī),為液冷數(shù)據(jù)中心提供全面的監(jiān)控與管理能力。72個(gè)NVIDIA Blackwell GPU和36個(gè)NVIDIA Grace CPU皆通過第五代NVIDIA NVLink和NVLink Switch連接,能有效地作為單個(gè)強(qiáng)大GPU運(yùn)行,并擁有高度容量的HBM3e內(nèi)存集區(qū),以實(shí)現(xiàn)低延遲的130TB/s總GPU通訊帶寬。
搭載NVIDIA H200 NVL的加速計(jì)算系統(tǒng)
Supermicro的 5U PCIe加速計(jì)算系統(tǒng)現(xiàn)可搭載NVIDIA H200 NVL,適用于需要彈性配置的低功耗、氣冷型企業(yè)級(jí)機(jī)架設(shè)計(jì),并能為許多AI和高性能計(jì)算工作負(fù)載進(jìn)行加速(無論機(jī)體尺寸大?。?。NVIDIA H200 NVL能通過NVIDIA NVLink,將最多四個(gè)GPU相連,并搭配1.5倍內(nèi)存容量,以及通過HBM3e得到提高的1.2倍帶寬,可實(shí)現(xiàn)數(shù)小時(shí)內(nèi)的LLM快速微調(diào),同時(shí)也提供比前一代快1.7倍的LLM 推理性能速度。NVIDIA H200 NVL亦包含NVIDIA AI Enterprise的五年服務(wù),而NVIDIA AI Enterprise是一個(gè)用于開發(fā)與部署生產(chǎn)型AI的云端原生軟件平臺(tái)。
Supermicro 的X14和H14 5U PCIe加速計(jì)算系統(tǒng)通過NVLink技術(shù)支持多達(dá)兩個(gè)4路NVIDIA H200 NVL系統(tǒng),在單個(gè)系統(tǒng)內(nèi)可搭載8個(gè)GPU,提供最高900GB/s的GPU互連傳輸速度,而每4-GPU NVLink域的組合集區(qū)具有 564GB 的 HBM3e 內(nèi)存。全新PCIe 加速計(jì)算系統(tǒng)支持最高10個(gè)PCIe GPU,現(xiàn)在也可搭載最新Intel Xeon 6或AMD EPYC 9005系列處理器,能為高性能計(jì)算和AI應(yīng)用提供靈活且多功能的選項(xiàng)。
Supermicro亮相2024年超級(jí)計(jì)算大會(huì)
Supermicro在超級(jí)計(jì)算大會(huì)上展示了完整的AI和高性能計(jì)算基礎(chǔ)架構(gòu)解決方案組合,包括用于AI SuperCluster的液冷GPU服務(wù)器。通過展位的演講議程,您可以了解客戶、Supermicro專家及我們的技術(shù)合作伙伴所介紹的最新突破性計(jì)算技術(shù)。
歡迎蒞臨Supermicro在2024年超級(jí)計(jì)算大會(huì)的展位,位于 B廳2531號(hào)。