人工智能大模型計(jì)算、高性能計(jì)算(HPC)以及數(shù)據(jù)中心等行業(yè)的迅猛發(fā)展,對計(jì)算機(jī)系統(tǒng)內(nèi)存性能的需求日益提升,業(yè)界對具備高帶寬、低延遲性能且超大容量的內(nèi)存需求也愈發(fā)迫切,以支持CPU和GPU進(jìn)行高速、大吞吐量的浮點(diǎn)運(yùn)算。在此背景下,江波龍日前在CFMS2024展出了一款基于Compute Express Link (CXL)技術(shù)的創(chuàng)新內(nèi)存擴(kuò)展設(shè)備——CXL 2.0 AIC內(nèi)存擴(kuò)展卡,為計(jì)算機(jī)系統(tǒng)提供了強(qiáng)大的內(nèi)存支持。
據(jù)悉,這款CXL 2.0 AIC內(nèi)存擴(kuò)展卡采用了非DRAM on-board封裝設(shè)計(jì),可兼容多種容量和規(guī)格的直插式內(nèi)存條。它不僅支持CXL1.1標(biāo)準(zhǔn),實(shí)現(xiàn)單個(gè)計(jì)算節(jié)點(diǎn)服務(wù)器線纜直連的直插式內(nèi)存條擴(kuò)展,還兼容CXL2.0標(biāo)準(zhǔn),支持多個(gè)計(jì)算節(jié)點(diǎn)服務(wù)器集群與存儲(chǔ)池線纜直連的直插式內(nèi)存池化,從而滿足多樣化的應(yīng)用場景需求。
江波龍CXL2.0 AIC內(nèi)存擴(kuò)展卡的一大亮點(diǎn)在于其采用了全高全長PCIe Add-in Card (AIC)封裝,配備了8個(gè)DIMM插槽,支持DDR4 RDIMM內(nèi)存條,內(nèi)存容量可擴(kuò)展至512GB,同時(shí)通過MCIO高速接口支持PCIe 5.0 x16通道,理論帶寬可達(dá)驚人的128GB/s。該產(chǎn)品與支持CXL規(guī)范的服務(wù)器主板通過MCIO線纜直連,從而為單個(gè)服務(wù)器和服務(wù)器集群提供大容量、高帶寬、低延遲的擴(kuò)展內(nèi)存。
在CFMS2024現(xiàn)場,該產(chǎn)品的研發(fā)負(fù)責(zé)人全面介紹了該產(chǎn)品各項(xiàng)特性和競爭優(yōu)勢,筆者從這款創(chuàng)新產(chǎn)品的前瞻性布局,充分感受到了江波龍?jiān)趦?nèi)存技術(shù)領(lǐng)域的強(qiáng)大研發(fā)實(shí)力。
據(jù)悉,該產(chǎn)品能夠同時(shí)支持CXL1.1(單個(gè)計(jì)算節(jié)點(diǎn) 服務(wù)器線纜直連的 直插式內(nèi)存擴(kuò)展)和CXL2.0(多個(gè)計(jì)算節(jié)點(diǎn) 服務(wù)器集群與存儲(chǔ)池線纜直連的 直插式內(nèi)存池化),具有更強(qiáng)的適配性。
在性能方面,江波龍CXL 2.0 AIC內(nèi)存擴(kuò)展卡實(shí)測性能遠(yuǎn)超業(yè)界現(xiàn)有DRAM on-board封裝的E3.S DDR5內(nèi)存拓展模塊,帶寬高達(dá)54GB/s,延遲低至213.3ns。此外,對比了市面上其他同類型產(chǎn)品,筆者發(fā)現(xiàn)江波龍這款產(chǎn)品在性能方面有較大的優(yōu)勢,這對AI算力、高性能計(jì)算和數(shù)據(jù)中心等領(lǐng)域的處理能力和運(yùn)算效率的提升,無疑起到了積極的“助推器”作用。
(CXL 2.0內(nèi)存擴(kuò)展性能對比)
若在一個(gè)單個(gè)機(jī)箱內(nèi)集成8個(gè)CXL 2.0 AIC內(nèi)存擴(kuò)展卡,就可以形成一個(gè)存儲(chǔ)池,其容量高達(dá)4TB,帶寬可達(dá)1TB,通過MCIO接口連接服務(wù)器,為高性能計(jì)算集群提供了前所未有的內(nèi)存擴(kuò)展能力。
業(yè)界專家普遍認(rèn)為,AI算法,如深度學(xué)習(xí)模型,通常需要處理大量的數(shù)據(jù)集,并且涉及復(fù)雜的矩陣運(yùn)算,內(nèi)存的帶寬和延遲會(huì)直接影響到模型訓(xùn)練和推理的速度。尤其是HPC高性能計(jì)算任務(wù),如科學(xué)模擬、天氣預(yù)測和生物信息學(xué)分析,更需要快速處理和分析大量數(shù)據(jù)。而CXL 2.0 AIC內(nèi)存擴(kuò)展卡的誕生,標(biāo)志著內(nèi)存技術(shù)的一大飛躍,它不僅解決了現(xiàn)有計(jì)算機(jī)系統(tǒng)內(nèi)存性能瓶頸的問題,還提升了計(jì)算效率,為AI算力、HPC高性能計(jì)算和數(shù)據(jù)中心等領(lǐng)域的未來發(fā)展提供了強(qiáng)有力的技術(shù)支持。
隨著技術(shù)的不斷進(jìn)步和應(yīng)用的深入拓展,CXL 2.0 AIC內(nèi)存擴(kuò)展卡有望在高性能計(jì)算領(lǐng)域發(fā)揮越來越重要的作用,并助力AI模型訓(xùn)練、大數(shù)據(jù)分析、科學(xué)計(jì)算等領(lǐng)域?qū)崿F(xiàn)更高效的運(yùn)算,推動(dòng)存儲(chǔ)行業(yè)和數(shù)據(jù)中心的技術(shù)進(jìn)步和創(chuàng)新發(fā)展。期待江波龍繼續(xù)在內(nèi)存技術(shù)上不斷鉆研,為全球算力的提升和數(shù)字化轉(zhuǎn)型的加速推進(jìn)做出積極貢獻(xiàn)