人工智能AI吹起新一輪科技革命浪潮,衍生出諸多新興應(yīng)用,龐大的需求驅(qū)動(dòng)存儲技術(shù)更迭。隨著AI模型和數(shù)據(jù)集不斷擴(kuò)大,高效、高性能的存儲顯得愈發(fā)關(guān)鍵,符合AI模型需求的DDR、GDDR、HBM技術(shù)從幕后走向臺前,并隨著AI發(fā)展而不斷推陳出新。
01、DDR不斷沿襲,DDR6即將來臨
DDR完整的應(yīng)該稱DDR SDRAM,英文全稱為Double Data Rate SDRAM,中文含義是雙倍速率同步動(dòng)態(tài)隨機(jī)存儲器”,應(yīng)用于高性能服務(wù)器、臺式機(jī)、筆記本電腦及其他設(shè)備中,該技術(shù)將高帶寬和高能效結(jié)合在一起,可以使性能翻倍。
從本質(zhì)上講,DDR是現(xiàn)有SDRAM內(nèi)存的一種進(jìn)化,SDRAM在一個(gè)時(shí)鐘周期內(nèi)只傳輸一次數(shù)據(jù),是在時(shí)鐘的上升期進(jìn)行數(shù)據(jù)傳輸,而DDR內(nèi)存在一個(gè)時(shí)鐘周期內(nèi)可以傳輸兩次數(shù)據(jù),它能夠在時(shí)鐘的上升期和下降期各傳輸一次數(shù)據(jù),因此得名“雙倍速率同步動(dòng)態(tài)隨機(jī)存儲器”。在與SDRAM相同的總線頻率下,DDR內(nèi)存可以達(dá)到更高的數(shù)據(jù)傳輸率,帶來優(yōu)異的數(shù)據(jù)處理性能。
DDR內(nèi)存根據(jù)時(shí)鐘邊沿讀取數(shù)據(jù)情況分為SDR、DDR技術(shù)。經(jīng)過多年的發(fā)展,DDR已從第一代DDR SDRAM,第二代DDR2 SDRAM,第三代DDR3 SDRAM,第四代DDR4 SDRAM,發(fā)展至第五代DDR5 SDRAM、第六代DDR6 SDRAM。
隨著技術(shù)的進(jìn)步,DDR內(nèi)存的版本不斷更新,每一代的DDR產(chǎn)品都提供更高的帶寬和更低的功耗。從目前主流的DDR4、DDR5來看,DDR5內(nèi)存的工作電壓進(jìn)一步降低至1.1V,相較于DDR4進(jìn)一步提高了能效,帶寬相較于DDR4有大幅提升。
據(jù)JEDEC(固態(tài)技術(shù)協(xié)會)6月初消息,DDR6(包括LPDDR6)已明確會以CAMM2取代使用多年的SO-DIMM和DIMM內(nèi)存標(biāo)準(zhǔn)。DDR6內(nèi)存最低頻率8800MHz,可提高至17.6GHz,理論最高可以推進(jìn)至21GHz,遠(yuǎn)超DDR4和DDR5內(nèi)存。
業(yè)界認(rèn)為,從市場普及來看,DDR6采用的標(biāo)準(zhǔn)是全新的CAMM2,生產(chǎn)設(shè)備也要做大規(guī)模替換,這會帶來全新的成本結(jié)構(gòu)。同時(shí),存量市場的新標(biāo)準(zhǔn)迭代也會受限成本要求,這都限制了DDR6或LPDDR6的大規(guī)模普及速度。
圖片來源:全球半導(dǎo)體觀察制表
高速、高性能的DDR內(nèi)存顆粒成為在人工智能、云計(jì)算、物聯(lián)網(wǎng)、計(jì)算機(jī)等領(lǐng)域的優(yōu)選存儲方案。從AI領(lǐng)域來看,AI算法需大量數(shù)據(jù)訓(xùn)練與推理,DDR作為電腦內(nèi)存的主要組件,能確保數(shù)據(jù)傳輸及存儲穩(wěn)健可靠;云計(jì)算領(lǐng)域,DDR在云服務(wù)器內(nèi)承擔(dān)大容量數(shù)據(jù)處理與傳輸?shù)闹厝?;物?lián)網(wǎng)領(lǐng)域,物聯(lián)設(shè)備需要滿足低耗能、高效率以及穩(wěn)定可靠的特性,DDR恰好滿足上述要求,可實(shí)現(xiàn)設(shè)備間的有效連接與交互。
02、探索GDDR過往,GDDR7已來
GDDR英文全稱Graphics Double Data Rate DRAM,是專為圖形處理而設(shè)計(jì)的高性能DDR存儲器規(guī)格,簡稱為顯存。顯存最關(guān)鍵的應(yīng)用領(lǐng)域便是顯卡,后者應(yīng)用于新媒體和電腦游戲、炒賣加密貨幣、AI強(qiáng)化學(xué)習(xí)(如ChatGPT、Sora)等領(lǐng)域。而用于顯卡的DRAM,需要具備兩個(gè)關(guān)鍵的特性,高密度尋址能力和配備的高性能,早期因主要考慮兼容CPU,顯卡大多采用DDR內(nèi)存,不過近年隨著圖像處理需求的增加,顯卡逐漸轉(zhuǎn)向?qū)镚PU設(shè)計(jì)的GDDR。
業(yè)界指出,GDDR有專屬的工作頻率、時(shí)鐘頻率、電壓,因此與市面上標(biāo)準(zhǔn)的DDR存儲器有所差異,與普通DDR內(nèi)存不同,且不能共用。一般它比主內(nèi)存中使用的普通DDR存儲器時(shí)鐘頻率更高,發(fā)熱量更小,具有更高的頻率和帶寬,所以更適用于中高端顯卡。
目前,GDDR已成為人工智能、大數(shù)據(jù)應(yīng)用領(lǐng)域中最熱門的內(nèi)存芯片之一。從類型上看,GDDR包括GDDR2、GDDR3、GDDR4、GDDR5、GDDR5X、GDDR6和GDDR6X等,GDDR5和GDDR6是高端顯卡上常見的顯存類型。其實(shí),前兩代的GDDR和GDDR2并沒有得到GPU廠商的大規(guī)模應(yīng)用,但隨著性能的提升,第三代GDDR3數(shù)據(jù)傳輸速率最高達(dá)到2.5GHz,第四代GDDR4雖然性能有了進(jìn)一步變化,但由于下游廠商對GDDR4標(biāo)準(zhǔn)意見不一,市場度接受度不高。為此GDDR3成為當(dāng)時(shí)市場主流技術(shù),包括英偉達(dá)和AMD等頭部GPU廠商都使用的GDDR3。
從2008年后,產(chǎn)品更新至GDDR5,因具備更高的時(shí)鐘頻率和數(shù)據(jù)傳輸速率成為高性能顯卡的標(biāo)配,GDDR5與GDDR4、GDDR3一樣,皆是基于DDR3技術(shù)開發(fā)而來。據(jù)悉,GDDR5之后,英偉達(dá)與美光共同合作推出GDDR5X半代產(chǎn)品,應(yīng)用于前者的高端顯卡。
據(jù)悉,英偉達(dá)是首家在其RTX 30 系列GPU中選擇GDDR6X內(nèi)存的供應(yīng)商,至少是高端GPU。GDDR6X將每引腳帶寬以14Gbps增加到21Gbps,將總帶寬增加到1008GB/s,甚至超過3072位寬的HBM2堆棧。值得一提是,GDDR6X還引入了PAM4(Pulse Amplitude Modulation 4)信號技術(shù),顯著提高了數(shù)據(jù)傳輸速率。
圖片來源:全球半導(dǎo)體觀察制表
目前,今年來,美光、三星和SK海力士均表示已開始提供GDDR7內(nèi)存樣品。具體來看,三星GDDR7芯片通過首次應(yīng)用PAM3信號,能夠在僅1.1 V的DRAM電壓下實(shí)現(xiàn)32 Gbps的速度,這超過了JEDEC的GDDR7規(guī)范中的1.2 V;SK海力士與其前身GDDR6相比,最新的GDDR7產(chǎn)品提供的最大帶寬達(dá)到160GB/s,是其上一代產(chǎn)品(GDDR6位80GB/s)的兩倍,功耗效率提升了40%,內(nèi)存密度提升1.5倍;美光GDDR7具有28GB/s和32Gb/s兩種速度,采用其1β (1-beta) DRAM 技術(shù)制造,其效率比GDDR6 提高了50%。
03、HBM成“軍備競賽”核心,主力來到HBM3E
HBM是高帶寬存儲器,屬于圖形DDR內(nèi)存的一種,是通過使用先進(jìn)的封裝方法(如TSV硅通孔技術(shù))垂直堆疊多個(gè)DRAM,與GPU通過中介層互聯(lián)封裝在一起。HBM具備高容量、高帶寬、低延時(shí)與低功耗等特性,其優(yōu)勢在于打破內(nèi)存帶寬及功耗瓶頸。不過,HBM由于其復(fù)雜的設(shè)計(jì)及封裝工藝導(dǎo)致產(chǎn)能較低同時(shí)成本較高,HBM的平均售價(jià)至少是DRAM的三倍。
與傳統(tǒng)DRAM芯片相比,HBM具有高帶寬、高容量、低延時(shí)與低功耗等優(yōu)勢,可以加快AI數(shù)據(jù)處理速度。業(yè)界指出,HBM可以將專用數(shù)據(jù)處理器直接集成在DRAM中,將部分?jǐn)?shù)據(jù)計(jì)算工作從主機(jī)處理器轉(zhuǎn)移到存儲器當(dāng)中,從而滿足AI芯片訓(xùn)練的高寬帶要求,也因此更適用于ChatGPT等高性能計(jì)算場景。
圖片來源:全球半導(dǎo)體觀察制表
從技術(shù)迭代上看,HBM已經(jīng)從HBM、HBM2、HBM2E,發(fā)展至被業(yè)界認(rèn)為即將成為市場主流的HBM3、HBM3E,未來或?qū)⒌竭_(dá)HBM4,甚至HBM4E。從大廠最新動(dòng)態(tài)來看,三星已開始向客戶提供HBM3E 12H樣品,預(yù)計(jì)于今年下半年開始大規(guī)模量產(chǎn);美光已開始量產(chǎn)HBM3E,英偉達(dá)H200 Tensor Core GPU將采用美光8層堆疊的24GB容量HBM3E內(nèi)存,并于2024年第二季度開始出貨;SK海力士已成功量產(chǎn)超高性能用于AI的存儲器新產(chǎn)品HBM3E,實(shí)現(xiàn)了全球首次向客戶供應(yīng)現(xiàn)有DRAM最高性能的HBM3E。
至于HBM4,業(yè)界稱,隨著內(nèi)存?zhèn)鬏斔俾室蟛粩嗵岣撸绕涫窃贒RAM單元的基礎(chǔ)物理原理沒有改變的情況下,這一速度將無法滿足未來AI場景下的數(shù)據(jù)傳輸要求。HBM從每堆疊1024位元增加到每堆疊2048位,HBM4將帶來突破性變革,采用2048位元內(nèi)存接口,理論上也可以使傳輸速度再次翻倍。
TrendForce集邦咨詢預(yù)計(jì),HBM4有望于2026年推出。目前包含NVIDIA以及其他CSP(云端業(yè)者)在未來的產(chǎn)品應(yīng)用上,規(guī)格和效能將更優(yōu)化。例如,隨著客戶對運(yùn)算效能要求的提升,HBM4在堆棧的層數(shù)上,除了現(xiàn)有的12hi (12層)外,也將再往16hi (16層)發(fā)展,更高層數(shù)也預(yù)估帶動(dòng)新堆棧方式hybrid bonding的需求。HBM4 12hi產(chǎn)品將于2026年推出;而16hi產(chǎn)品則預(yù)計(jì)于2027年問世。
從市場格局來看,目前,HBM市場高度集中,呈現(xiàn)三足鼎立的態(tài)勢。此前據(jù)TrendForce集邦咨詢研究顯示,2022年三大原廠HBM市占率分別為SK海力士(SK hynix)50%、三星(Samsung)約40%、美光(Micron)約10%。
結(jié) 語
AI就像一顆巨大能量的隕星,給予內(nèi)存市場最新的沖擊。隨著市場提出的新挑戰(zhàn),三星、美光、SK海力士等大廠正埋頭專心研發(fā),致力于引領(lǐng)下一代圖形內(nèi)存技術(shù)的發(fā)展。業(yè)界十分關(guān)心的性能、能效、成本等問題,上述中提到的DDR、GDDR、HBM技術(shù)將如何發(fā)展,大廠們在這場內(nèi)存技術(shù)競賽中又將帶來何種新的解決方案,讓我們拭目以待。
全球市場研究機(jī)構(gòu)TrendForce集邦咨詢此前預(yù)計(jì),2023年HBM產(chǎn)值占比之于DRAM整體產(chǎn)業(yè)約8.4%,至2024年底將擴(kuò)大至20.1%。同時(shí),新型存儲技術(shù)也不斷涌現(xiàn),3D DRAM時(shí)代即將開啟;SCM潛力即將釋放,PCIe 6.0/7.0蓄勢待發(fā)…