作者:豐寧
在英偉達(dá)一步步站穩(wěn)萬(wàn)億市值腳根的道路上,少不了兩項(xiàng)關(guān)鍵技術(shù)支持,其中之一是由臺(tái)積電主導(dǎo)的CoWoS先進(jìn)封裝,另一個(gè)便是席卷當(dāng)下的HBM(高帶寬存儲(chǔ))。
英偉達(dá)H200是首次采用HBM3E存儲(chǔ)器規(guī)格的AI加速卡。借助內(nèi)存速度更快、容量更大的HBM3e,英偉達(dá)H200以每秒4.8TB的速度提供141GB的內(nèi)存,與A100相比,容量幾乎是其兩倍,帶寬也提升了43%,從而加速生成式AI和大語(yǔ)言模型,提高高性能計(jì)算(HPC)的工作負(fù)載。
隨著人工智能的興起,HBM成為巨頭們搶占的高地。三星、SK海力士、美光等存儲(chǔ)巨頭紛紛將HBM視為重點(diǎn)生產(chǎn)產(chǎn)品之一。HBM的火熱,給市場(chǎng)掀起巨大波瀾。一起看看HBM這股熱潮給市場(chǎng)帶來(lái)了哪些轉(zhuǎn)折?
?01、HBM走紅,帶來(lái)三大影響
HBM成為力挽行業(yè)下行的關(guān)鍵詞之一
數(shù)個(gè)季度的持續(xù)低迷下,頭部存儲(chǔ)廠商相繼展現(xiàn)出季度收入環(huán)比增長(zhǎng)趨勢(shì),其中以SK海力士的表現(xiàn)最為亮眼,背后就離不開由HBM拉動(dòng)對(duì)DRAM的需求提升。今年Q1,SK海力士收入創(chuàng)歷史同期新高,營(yíng)業(yè)利潤(rùn)也創(chuàng)下了市況最佳的2018年以來(lái)同期第二高,公司將其視為擺脫了長(zhǎng)時(shí)間的低迷期,開始轉(zhuǎn)向了全面復(fù)蘇期。
SK海力士表示:“憑借HBM等面向AI的存儲(chǔ)器技術(shù)領(lǐng)導(dǎo)力,公司提升了面向AI服務(wù)器的產(chǎn)品銷量,同時(shí)持續(xù)實(shí)施以盈利為主的經(jīng)營(yíng)活動(dòng),從而實(shí)現(xiàn)了營(yíng)業(yè)利潤(rùn)環(huán)比增長(zhǎng)734%的業(yè)績(jī)。”三星電子曾表示生成式AI市場(chǎng)應(yīng)用將帶來(lái)HBM等支持大規(guī)模數(shù)據(jù)處理的內(nèi)存產(chǎn)品需求快速增長(zhǎng),公司接到了大量客戶需求。預(yù)計(jì)2024年HBM的需求可能出現(xiàn)陡峭增長(zhǎng)。美光表示,AI服務(wù)器的DRAM容量是普通服務(wù)器的6倍到8倍,NAND容量是普通服務(wù)器的3倍。英偉達(dá)DGX GH200所需的DRAM容量是普通服務(wù)器的數(shù)百倍。
通用DRAM恐缺貨漲價(jià)
通用型DRAM內(nèi)存芯片面臨的供應(yīng)短缺,主要源于業(yè)界對(duì)HBM等類型的DRAM進(jìn)行了大量的投資,而通用型DRAM的產(chǎn)能利用率相對(duì)較低。目前,三星和SK海力士的產(chǎn)能利用率僅為80%到90%,遠(yuǎn)低于NAND閃存的全速生產(chǎn)狀態(tài)。
自2024年初以來(lái),通用型DRAM的產(chǎn)能僅提升了大約10%,但智能手機(jī)、PC和服務(wù)器市場(chǎng)的增長(zhǎng)率預(yù)計(jì)僅為2%到3%。全球云計(jì)算和科技公司在AI基礎(chǔ)設(shè)施上的投資削減,并未能顯著推動(dòng)DRAM需求的復(fù)蘇。然而,在同一時(shí)期內(nèi),企業(yè)級(jí)固態(tài)硬盤(eSSD)的需求卻因人工智能的普及而激增。因此,三星、SK海力士等主要制造商在第二季度滿負(fù)荷運(yùn)行其NAND生產(chǎn)線。此外,鎧俠也在市場(chǎng)條件改善后結(jié)束了減產(chǎn),NAND產(chǎn)能利用率恢復(fù)至100%。
由于通用DRAM內(nèi)存芯片在消費(fèi)市場(chǎng),如個(gè)人電腦和移動(dòng)終端等領(lǐng)域發(fā)揮著巨大作用,而隨著市場(chǎng)需求的放大,可能會(huì)出現(xiàn)大范圍的短缺。根據(jù)摩根士丹利最新報(bào)告,全球內(nèi)存市場(chǎng)在2025年將迎來(lái)一次前所未有的供需失衡,2025年HBM的供應(yīng)不足率將達(dá)到-11%,而整個(gè)DRAM市場(chǎng)的供應(yīng)不足率將高達(dá)-23%。
爭(zhēng)奪戰(zhàn),不只是技術(shù)
存儲(chǔ)巨頭在HBM技術(shù)領(lǐng)域的爭(zhēng)奪戰(zhàn)日益激烈,從HBM1到HBM2、HBM3,再到最新的HBM3e,每一代技術(shù)的演進(jìn)都標(biāo)志著存儲(chǔ)性能的顯著提升和市場(chǎng)競(jìng)爭(zhēng)的加劇。HBM1最早于2014年由AMD與SK海力士共同推出,作為GDDR競(jìng)品,為4層die堆疊,提供128GB/s帶寬,4GB內(nèi)存,顯著優(yōu)于同期GDDR5。
HBM2于2016年發(fā)布,2018年正式推出,為4層DRAMdie,現(xiàn)在多為8層die,提供256GB/s帶寬,2.4Gbps傳輸速度,和8GB內(nèi)存。HBM2E于2018年發(fā)布,于2020年正式提出,在傳輸速度和內(nèi)存等方面均有較大提升,提供3.6Gbps傳輸速度,和16GB內(nèi)存。HBM3于2020年發(fā)布,2022年正式推出,堆疊層數(shù)及管理通道數(shù)均有增加,提供6.4Gbps傳輸速度,傳輸速度最高可達(dá)819GB/s,和16GB內(nèi)存。HBM3E由SK海力士發(fā)布HBM3的增強(qiáng)版,提供高達(dá)8Gbps的傳輸速度,24GB容量,2024年開始大規(guī)模量產(chǎn)。
然而這不僅僅是一場(chǎng)單純的技術(shù)較量,更是一場(chǎng)激烈無(wú)比的產(chǎn)能競(jìng)賽。根據(jù)存儲(chǔ)三巨頭表示,今年的HBM供應(yīng)能力已全部耗盡,明年的產(chǎn)能也已經(jīng)大部分售罄。據(jù)專業(yè)機(jī)構(gòu)分析,今明兩年HBM需求的動(dòng)態(tài)缺口約為產(chǎn)能的5.5%和3.5%。因此,三大廠商紛紛開啟產(chǎn)能沖刺競(jìng)賽。比如SK海力士正在大幅擴(kuò)產(chǎn)第5代1b DRAM,以應(yīng)對(duì)HBM與DDR5 DRAM的需求增加。
按照晶圓投入量看,公司計(jì)劃將1b DRAM月產(chǎn)能從今年一季度的1萬(wàn)片增加到年末的9萬(wàn)片,到明年上半年進(jìn)一步提升至14萬(wàn)-15萬(wàn)片,是今年一季度產(chǎn)能的14-15倍。三星3月底曾表示,預(yù)計(jì)今年HBM產(chǎn)能將增至去年的2.9倍。美光正在美國(guó)建設(shè)先進(jìn)的HBM測(cè)試生產(chǎn)線,并考慮首次在馬來(lái)西亞生產(chǎn)HBM,以抓住AI熱潮帶來(lái)的更多需求。
?02、相比GDDR,HBM強(qiáng)在哪兒?
根據(jù)產(chǎn)品分類,DRAM 可以分為 DDR、LPDDR、GDDR、HBM。前三類產(chǎn)品主要用于傳統(tǒng)周期領(lǐng)域,HBM 則主要是 AI 市場(chǎng)的帶動(dòng)。其中 DDR 主要用于消費(fèi)電子、服務(wù)器、PC 領(lǐng)域;LPDDR主要用于移動(dòng)設(shè)備、手機(jī)及汽車領(lǐng)域;GDDR 主要用于圖像處理方面的 GPU 等。
隨著數(shù)據(jù)量越發(fā)龐大加之AI芯片的加速發(fā)展,馮氏計(jì)算架構(gòu)問(wèn)題凸顯:“存”“算”之間性能失配,使得計(jì)算機(jī)的計(jì)算能力增長(zhǎng)遇到瓶頸,雖然多核并行加速技術(shù)可以提高算力,但存儲(chǔ)帶寬的限制仍對(duì)計(jì)算系統(tǒng)的算力提升產(chǎn)生了制約。GDDR是目前應(yīng)用較為廣泛的顯存技術(shù),但在AI計(jì)算領(lǐng)域GDDR也難堪重任,于是制造商將目光投向HBM技術(shù)。
HBM具備高帶寬的優(yōu)勢(shì)。通過(guò)多層堆疊,HBM能達(dá)到更高的I/O數(shù)量,使得顯存位寬達(dá)到1024位,幾乎是GDDR的32倍,顯存帶寬顯著提升。顯存帶寬顯著提升解決了過(guò)去AI計(jì)算“內(nèi)存墻”的問(wèn)題,HBM逐步提高在中高端數(shù)據(jù)中心GPU中的滲透比率。
HBM具備高密度、小體積等優(yōu)勢(shì)。相比傳統(tǒng)DRAM,HBM在相同的物理空間內(nèi)能夠容納更多的存儲(chǔ)單元,從而提供更高的存儲(chǔ)容量。這對(duì)于存儲(chǔ)千億參數(shù)乃至更大規(guī)模的大模型至關(guān)重要。此外,HBM通過(guò)3D封裝工藝實(shí)現(xiàn)DRAM die的垂直方向堆疊封裝,可以較大程度節(jié)約存儲(chǔ)芯片在片上占據(jù)的面積。HBM芯片的尺寸比傳統(tǒng)的DDR4芯片小20%,比GDDR5芯片節(jié)省了94%的表面積。根據(jù)三星電子的統(tǒng)計(jì),3D TSV工藝較傳統(tǒng)POP封裝形式節(jié)省了35%的封裝尺寸。
受構(gòu)造影響,GDDR的總帶寬上限低于HBM。總帶寬=I/O數(shù)據(jù)速率(Gb/s)*位寬/8。為解決DDR帶寬較低的問(wèn)題,本質(zhì)上需要對(duì)單I/O的數(shù)據(jù)速率和位寬(I/O數(shù)*單I/O位寬)進(jìn)行提升,可分為GDDR單體式方案和HBM堆疊式方案。單體式GDDR采取大幅提升單I/O數(shù)據(jù)速率的手段來(lái)改善總帶寬,GDDR5和GDDR6的單I/O數(shù)據(jù)速率已達(dá)到7 Gb/s到16Gb/s,超過(guò)HBM3的6.4 Gb/s。HBM利用TSV技術(shù)提升I/O數(shù)和單I/O位寬,從而大幅提升位寬,雖然維持較低的單I/O數(shù)據(jù)速率,但總帶寬遠(yuǎn)優(yōu)于GDDR。
HBM的綜合功耗也低于GDDR。HBM通過(guò)增加I/O引腳數(shù)量來(lái)降低總線頻率,從而實(shí)現(xiàn)更低的功耗。盡管片上分布的大量緩存能提供足夠的計(jì)算帶寬,但由于存儲(chǔ)結(jié)構(gòu)和工藝制約,片上緩存占用了大部分的芯片面積(通常為1/3至2/3),限制了算力提升。
如今,HBM已經(jīng)成為超級(jí)計(jì)算機(jī)、數(shù)據(jù)中心等核心設(shè)施中不可或缺的關(guān)鍵組件,為大規(guī)模并行計(jì)算提供了堅(jiān)實(shí)的內(nèi)存基礎(chǔ)。尤其在圖形處理領(lǐng)域,HBM的高帶寬特性使得GPU能夠更快速地訪問(wèn)和處理圖像數(shù)據(jù),從而為用戶帶來(lái)更加流暢、逼真的視覺體驗(yàn)。即便是業(yè)界領(lǐng)先的英偉達(dá),也對(duì)這一產(chǎn)品展現(xiàn)出了高度的依賴性。
據(jù)悉,英偉達(dá)近幾年發(fā)布的多款旗艦產(chǎn)品(如A100、H100、H200)均搭配了不同數(shù)量的HBM。HBM已然是英偉達(dá)AI芯片的必備搭檔。然而全球約九成的HBM市場(chǎng)被SK海力士和三星兩家韓系企業(yè)壟斷。
?03、2024年末,HBM是持續(xù)短缺?還是供過(guò)于求?
在存儲(chǔ)三巨頭的競(jìng)爭(zhēng)中,由于海力士HBM3產(chǎn)品性能領(lǐng)先,率先拿下英偉達(dá)訂單,成為其服務(wù)器GPU的主要供應(yīng)商。三星主攻一些云端客戶的訂單,美光則直接跳過(guò)了HBM3,將主要精力放在了HBM3E產(chǎn)品上。
僅從當(dāng)下來(lái)看,美光的市場(chǎng)占有率和前面兩個(gè)玩家有一些差距。但不管怎樣,三位存儲(chǔ)芯片的大佬都在擴(kuò)產(chǎn)能上不留余力。比如海力士已經(jīng)放下豪言壯語(yǔ),計(jì)劃到2028年投資高達(dá)748億美元,其中80%將用于HBM的研發(fā)和生產(chǎn),而且將下一代HBM4芯片的量產(chǎn)時(shí)間提前到2025年。據(jù)專業(yè)機(jī)構(gòu)分析,今明兩年HBM需求的動(dòng)態(tài)缺口約為產(chǎn)能的5.5%和3.5%。
不過(guò)根據(jù)海豚投研的數(shù)據(jù)顯示,HBM有望從2023年末的“供不應(yīng)求”轉(zhuǎn)為2024年末的“供大于求”。海豚投研比較了2023—2024年HBM的供需關(guān)系情況。 從需求端來(lái)看,結(jié)合云服務(wù)廠商的資本開支和AI出貨量情況,市場(chǎng)對(duì)HBM的需求有望從2023年的284MGB提升至512MGB; 從供給端來(lái)看,結(jié)合存儲(chǔ)主流廠商的產(chǎn)能計(jì)劃,HBM的供給端更可能從2023年的147MGB快速提升至1000MGB以上。
在此供需關(guān)系中,2023年供給端僅能滿足需求的1/2,嚴(yán)重供不應(yīng)求。供不應(yīng)求的局面,推動(dòng)各家廠商大幅提升產(chǎn)能計(jì)劃。如果產(chǎn)能規(guī)劃如實(shí)落地,2024年的HBM供需關(guān)系可能會(huì)出現(xiàn)明顯反轉(zhuǎn),供給端反而會(huì)超出整體的市場(chǎng)需求。
對(duì)于HBM的價(jià)格,當(dāng)前由于供給仍相對(duì)緊張,因此整體價(jià)格在2024年將有所上漲。但隨著三星產(chǎn)品通過(guò)認(rèn)證和產(chǎn)能端的釋放,HBM的產(chǎn)品價(jià)格也可能出現(xiàn)回落。
?04、國(guó)產(chǎn)廠商加速突破
隨著AIGC技術(shù)應(yīng)用的快速發(fā)展,AI服務(wù)器和高端GPU的需求持續(xù)增長(zhǎng),將進(jìn)一步推動(dòng)HBM市場(chǎng)的高速增長(zhǎng)。據(jù)預(yù)計(jì),到2025年,中國(guó)HBM的需求量規(guī)模有望超過(guò)100萬(wàn)顆。而中國(guó),在這一賽道還屬于后來(lái)者。
不久前,國(guó)家集成電路產(chǎn)業(yè)投資基金三期橫空出世。大基金三期注冊(cè)資本高達(dá)3440億元,這一規(guī)模遠(yuǎn)超前兩期基金,顯示出國(guó)家對(duì)集成電路產(chǎn)業(yè)的重視和大力支持。如此龐大的資金注入,無(wú)疑將為集成電路產(chǎn)業(yè)的發(fā)展提供強(qiáng)大的動(dòng)力。目前,大基金三期對(duì)外投資重點(diǎn)還未正式披露。
據(jù)悉,大基金三期有望增加覆蓋人工智能芯片環(huán)節(jié),在HBM產(chǎn)業(yè)鏈扶持大型晶圓廠。今年3月,武漢新芯發(fā)布了《高帶寬存儲(chǔ)芯粒先進(jìn)封裝技術(shù)研發(fā)和產(chǎn)線建設(shè)》招標(biāo)項(xiàng)目,這一行動(dòng)標(biāo)志著該公司正式進(jìn)軍HBM市場(chǎng)。通過(guò)利用三維集成多晶圓堆疊技術(shù),武漢新芯旨在打造更高容量、更大帶寬、更小功耗的存儲(chǔ)解決方案,以滿足市場(chǎng)對(duì)高性能存儲(chǔ)芯片的需求。
面對(duì)海外大廠對(duì)于 HBM3E 的量產(chǎn),國(guó)內(nèi)存儲(chǔ)廠商也在 HBM 技術(shù)上進(jìn)行著加速突破,有望在 AI 大浪潮的需求下提升競(jìng)爭(zhēng)實(shí)力。面對(duì)海外大廠對(duì)于 HBM3E 的量產(chǎn),國(guó)內(nèi)存儲(chǔ)廠商也在 HBM 技術(shù)上進(jìn)行著加速突破,有望在 AI 大浪潮的需求下提升競(jìng)爭(zhēng)實(shí)力。
封測(cè)龍頭長(zhǎng)電科技在投資者互動(dòng)中表示,其XDFOI高密度扇出封裝解決方案也同樣適用于HBM的Chip to Wafer 和Chip to Chip TSV堆疊應(yīng)用;通富微電此前表示,南通通富工廠先進(jìn)封裝生產(chǎn)線建成后,公司將成為國(guó)內(nèi)最先進(jìn)的2.5D/3D先進(jìn)封裝研發(fā)及量產(chǎn)基地,實(shí)現(xiàn)國(guó)內(nèi)在HBM(高帶寬內(nèi)存)高性能封裝技術(shù)領(lǐng)域的突破,對(duì)于國(guó)家在集成電路封測(cè)領(lǐng)域具有重要意義。
中國(guó)主要的存儲(chǔ)芯片公司也在與封測(cè)廠商通富微電合作開展HBM相關(guān)項(xiàng)目。然而總體來(lái)看,國(guó)內(nèi)廠商在HBM技術(shù)上的發(fā)展仍處于早期階段。盡管國(guó)際上已經(jīng)有了更先進(jìn)的HBM3和HBM3E產(chǎn)品,但國(guó)內(nèi)存儲(chǔ)廠商目前還處于HBM2的研發(fā)和產(chǎn)業(yè)化階段。面對(duì)海外大廠在HBM3E等先進(jìn)技術(shù)上的量產(chǎn)優(yōu)勢(shì),國(guó)內(nèi)廠商仍需加快追趕步伐,克服技術(shù)壁壘,實(shí)現(xiàn)從技術(shù)跟隨到技術(shù)引領(lǐng)的轉(zhuǎn)變。
在此過(guò)程中,客戶對(duì)于AI服務(wù)器性能、內(nèi)存帶寬及內(nèi)存大小的持續(xù)高要求,既是對(duì)HBM技術(shù)的巨大挑戰(zhàn),也是推動(dòng)其不斷前行的動(dòng)力源泉。值得注意的是,盡管HBM在帶寬性能上占據(jù)優(yōu)勢(shì)地位,但其高昂的成本與功耗也促使行業(yè)探索更多元化的解決方案。GDDR、LPDDR等內(nèi)存技術(shù)的快速發(fā)展,為AI處理器提供了更多選擇,尤其是在成本、性能與功耗之間尋求最佳平衡點(diǎn)的應(yīng)用場(chǎng)景中。例如,GDDR7的推出不僅顯著提升了內(nèi)存容量與數(shù)據(jù)傳輸率,還因其相對(duì)較低的復(fù)雜度成為部分AI應(yīng)用的理想之選。
綜上所述,隨著AI技術(shù)的不斷演進(jìn)與市場(chǎng)需求的日益多樣化,HBM作為高性能存儲(chǔ)技術(shù)的代表,將繼續(xù)在特定領(lǐng)域發(fā)揮關(guān)鍵作用。同時(shí),國(guó)內(nèi)廠商需緊抓機(jī)遇,加速技術(shù)創(chuàng)新與產(chǎn)業(yè)升級(jí),以更加靈活多樣的內(nèi)存解決方案,滿足AI時(shí)代對(duì)高性能計(jì)算的多元化需求。