加入星計(jì)劃,您可以享受以下權(quán)益:

  • 創(chuàng)作內(nèi)容快速變現(xiàn)
  • 行業(yè)影響力擴(kuò)散
  • 作品版權(quán)保護(hù)
  • 300W+ 專業(yè)用戶
  • 1.5W+ 優(yōu)質(zhì)創(chuàng)作者
  • 5000+ 長期合作伙伴
立即加入
  • 正文
    • ?01、AI系統(tǒng)的供電挑戰(zhàn)
    • ?02、服務(wù)器電源系統(tǒng)在演進(jìn)
    • ?03、更多電感方案
    • ?04、電容也很重要
    • ?05、無源器件廠商的機(jī)遇
    • ?06、結(jié)語
  • 推薦器件
  • 相關(guān)推薦
  • 電子產(chǎn)業(yè)圖譜
申請(qǐng)入駐 產(chǎn)業(yè)圖譜

高性能計(jì)算市場大漲,不起眼的元器件價(jià)值量提升8倍

03/29 09:44
1943
閱讀需 15 分鐘
加入交流群
掃碼加入
獲取工程師必備禮包
參與熱點(diǎn)資訊討論

作者:暢秋

隨著高性能計(jì)算(HPC)系統(tǒng),特別是AI服務(wù)器的市場規(guī)模不斷擴(kuò)大,其核心處理器,包括CPU、GPU、NPU、ASIC、FPGA等,以及內(nèi)存、網(wǎng)絡(luò)通信芯片元器件的性能和功耗水平都在提升。隨著性能提升,功率管理水平的提升顯得更加重要,因?yàn)镠PC系統(tǒng),特別是AI服務(wù)器的耗電量越來越大,對(duì)整個(gè)系統(tǒng),以及主要芯片的功率管理能力提出了更高要求。

在AI服務(wù)器中,CPU需要供電,GPU板卡需要供電,內(nèi)存(DDR4、DDR5、HBM)需要供電,各種接口也需要供電。此時(shí),電源管理系統(tǒng)就顯得非常重要了,除了AC/DC電源、DC/DC轉(zhuǎn)換器等,電源管理系統(tǒng)當(dāng)中用到的無源器件(以電感電容為主)也發(fā)揮著關(guān)鍵作用,隨著系統(tǒng)性能和功耗的提升,對(duì)這些無源器件的性能和數(shù)量提出了更高、更多的要求。

性能優(yōu)異的無源器件可以提供更加穩(wěn)定的電壓和電流,以確保AI服務(wù)器等HPC系統(tǒng)正常運(yùn)行,保證快速的瞬態(tài)響應(yīng)和較低的紋波。低損耗的無源器件可以提高AI服務(wù)器的能效,提升關(guān)鍵零部件的效率,節(jié)能環(huán)保。要保證AI服務(wù)器的可靠性和穩(wěn)定性,對(duì)電感提出了更高的需求。

?01、AI系統(tǒng)的供電挑戰(zhàn)

與普通服務(wù)器相比,AI服務(wù)器所需的配置和耗能更高。由于AI服務(wù)器的功率較普通服務(wù)器高6~8倍,對(duì)電源的要求也同步提升,目前,市面上的通用服務(wù)器一般需要2個(gè)800W電源,AI服務(wù)器最多需要4個(gè)1800W電源。

隨著服務(wù)器性能的提升,配套的電感變壓器數(shù)量必定會(huì)隨之增加。以芯片電感為例,有機(jī)構(gòu)報(bào)告指出,由于GPU數(shù)量的增加,AI服務(wù)器一共需要24~48個(gè)電感,以每個(gè)1美元計(jì)算,與普通服務(wù)器相比,AI服務(wù)器中的芯片電感價(jià)值量多出60%-220%。

另外,在AI服務(wù)器中,多相或耦合電感等多合一形式逐步替代單電感應(yīng)用;為了解決散熱、損耗問題,超薄應(yīng)用和電源模塊類供電將更加廣泛。

數(shù)據(jù)中心需要越來越多的AI加速卡,要配置大量處理器(xPU),多采用大規(guī)模并行計(jì)算方案,與普通CPU相比,xPU擁有大量小內(nèi)核,有助于神經(jīng)網(wǎng)絡(luò)訓(xùn)練和AI推理。然而,xPU進(jìn)行AI計(jì)算、傳輸數(shù)據(jù)時(shí)會(huì)產(chǎn)生較大功耗。也就是說,xPU是非常耗電的芯片,其嚴(yán)格的功耗要求對(duì)AI加速卡提出了新的挑戰(zhàn),這也會(huì)影響系統(tǒng)性能。

AI系統(tǒng)工作時(shí),尤其是處理深度學(xué)習(xí)和推理等工作負(fù)載時(shí),需要極高的計(jì)算功率。在系統(tǒng)層面,AI加速器對(duì)提供近乎實(shí)時(shí)的結(jié)果發(fā)揮著關(guān)鍵作用。所有xPU都有多個(gè)高端內(nèi)核,這些內(nèi)核由數(shù)十億個(gè)晶體管構(gòu)成,消耗數(shù)百安培電流。這些xPU的內(nèi)核電壓已降至1V的水平。

AI加速卡所需的峰值電流密度對(duì)任何主板來說都是非常沉重的負(fù)擔(dān),難以處理。工作負(fù)載的高度動(dòng)態(tài)特性和極高的電流瞬變會(huì)導(dǎo)致非常高的di/dt和持續(xù)數(shù)微秒的尖峰電壓瞬變,這些瞬變非常具有破壞性,可能會(huì)對(duì)xPU造成損害。AI的平均工作負(fù)載會(huì)持續(xù)很長時(shí)間,解耦電容將無法始終提供滿足即時(shí)需求的能量,此時(shí),需要消除AI加速器的瞬變,避免對(duì)整個(gè)配電網(wǎng)絡(luò)造成損害。

目前,xPU穩(wěn)壓器(VR)的要求與標(biāo)準(zhǔn)PoL穩(wěn)壓器有很大不同。某些應(yīng)用要求在小于1V的電壓下為xPU提供超過1000A的電流。此時(shí),必須控制好功耗,不然,系統(tǒng)很難穩(wěn)定工作。

如何降低AI系統(tǒng)能耗,成為了產(chǎn)業(yè)難題。目前,降低AI系統(tǒng)能耗的思路主要有兩種:一、降低AI系統(tǒng)核心處理器的能耗;二、優(yōu)化電源管理系統(tǒng),提高AI核心處理器電源管理的效率。然而,隨著AI等新興應(yīng)用的普及,傳統(tǒng)計(jì)算系統(tǒng)用到的AC/DC、DC/DC、多相電源控制器和DrMOS功率級(jí)組合等方案,效率已經(jīng)達(dá)到天花板,需要更先進(jìn)的電源管理方案。

?02、服務(wù)器電源系統(tǒng)在演進(jìn)

處理器的微型化導(dǎo)致了電源電壓降低,但消耗的電流不降反升,使得功耗持續(xù)增加。低電壓、大電流的發(fā)展趨勢(shì)帶來的問題之一是如何提升對(duì)負(fù)載波動(dòng)的快速響應(yīng)能力。

隨著電壓降低,電壓的容許公差變得非常小。比如,為了避免處理器的誤操作,若以±3%的精度提供磁芯電壓,則電壓為1V時(shí)的公差必須控制在±30mV。對(duì)于服務(wù)器專用電源,即使在超過1000A的大電流負(fù)載驟變的驅(qū)動(dòng)條件下,輸出電壓也必須盡可能保持穩(wěn)定。

在實(shí)際應(yīng)用中,低電壓、大電流發(fā)展趨勢(shì)一直在持續(xù),通常采用高頻化和多相位化來應(yīng)對(duì)。以更高的頻率進(jìn)行開關(guān)操作允許采用體積更小的組件(如電容器電感器)來管理和平滑輸入和輸出電路中的能量流動(dòng)。對(duì)于基于普通硅功率半導(dǎo)體器件的轉(zhuǎn)換器,其典型開關(guān)頻率為30~80kHz,在這樣的頻率下,可以采用被廣泛認(rèn)可的電容器,具有成本效益。然而,在這個(gè)頻率范圍之上,寄生效應(yīng)就會(huì)導(dǎo)致過多的電阻損耗和自生熱。

雖然提高頻率對(duì)改善負(fù)載響應(yīng)有很大作用,但也會(huì)極大地增加開關(guān)元件的損耗。此外,通過使用大容量外部電容器,可以在一定程度上抑制大電流應(yīng)用的電壓波動(dòng),但這會(huì)增加安裝面積和電容器成本。

考慮到上述諸多情況,TLVR(Trans-Inductor Voltage Regulators)是目前應(yīng)對(duì)低電壓、大電流應(yīng)用中快速負(fù)載波動(dòng)的主流電路配置方案。該方案是讓每個(gè)相位開關(guān)連接到一個(gè)帶額外繞組的電感器上,然后將每個(gè)相位的繞組和補(bǔ)償電感器串聯(lián)成回路,以便同時(shí)為每個(gè)相位提供電流。TLVR能使處理器獲得較高的瞬態(tài)響應(yīng)性能,滿足負(fù)載要求,而且電源電壓幾乎不會(huì)降低,同時(shí)降低電源損耗,可保持較小的輸出電容值,從而減少安裝面積和系統(tǒng)成本。

?03、更多電感方案

在高性能計(jì)算系統(tǒng),特別是AI服務(wù)器的電源管理系統(tǒng)中,電感方案越來越多,除了上述的TLVR,還有一體成型電感、芯片電感、超薄一體成型電感等產(chǎn)品。

芯片電感起到為芯片前端供電的作用,主要用于電壓、電流轉(zhuǎn)換,常見于電源管理芯片(PMIC)、FPGA供電電路中。在高性能計(jì)算系統(tǒng)中,芯片電感、電容、MOS管驅(qū)動(dòng)芯片共同構(gòu)成供電電路,滿足GPU和CPU的供電需求。

目前,主流的芯片電感采用鐵氧體材質(zhì),但鐵氧體飽和特性較差,隨著電源模塊的小型化和電流的增加,鐵氧體電感體積和飽和特性已經(jīng)難以滿足高性能GPU的要求,近些年,出現(xiàn)了一種金屬軟磁材料電感,它具有更高的效率、更小的體積,能夠更好地響應(yīng)大電流變化。采用金屬軟磁材料的芯片電感,適用開關(guān)頻率可達(dá)500kHz~10MHz。

還有一種芯片電感,它基于半導(dǎo)體薄膜工藝,采用光刻加工工藝,不同于傳統(tǒng)的繞線電感和一體成型電感工藝,半導(dǎo)體薄膜工藝的最大特色是可以實(shí)現(xiàn)芯片電感產(chǎn)品整版生產(chǎn),提高了生產(chǎn)效率。傳統(tǒng)電源模塊基于SIP工藝,將芯片與電感合封在一個(gè)封裝基座上,將功率電感與封裝基座一體加工,實(shí)現(xiàn)功率電感與封裝基座的二合一。相比傳統(tǒng)的SIP需要“芯片+電感+基座”,基于半導(dǎo)體薄膜工藝的方案只需將芯片與集成電感及其它器件合封,即可實(shí)現(xiàn)完整的電源模塊和周邊電路功能,進(jìn)一步減小了電源模塊的體積,同時(shí)提升了功率密度,降低了成本。

這種芯片電感采用了新的磁性材料磁導(dǎo)率飽和電流都很好,在6MHz頻率下,電感的材料損耗占電感總損耗比例很低。

?04、電容也很重要

在高性能計(jì)算的電源管理系統(tǒng)中,除了電感,電容和熱敏電阻的更新?lián)Q代也在進(jìn)行中。

目前,AI服務(wù)器在整體高性能計(jì)算市場的占比仍較低,因此,還沒有市調(diào)機(jī)構(gòu)統(tǒng)計(jì)AI服務(wù)器對(duì)MLCC(片式多層陶瓷電容器)的消耗量,但是,就發(fā)展形勢(shì)來看,無源器件分銷商普遍看好電容,特別是MLCC在AI服務(wù)器中的應(yīng)用前景,2024下半年將出現(xiàn)明顯增長態(tài)勢(shì),MLCC規(guī)格、單價(jià)都將大幅提升。

在技術(shù)層面,計(jì)算系統(tǒng)處理器都需要電容配合工作,傳統(tǒng)上,這些電容都采用鉭或聚合物電容器。以減少對(duì)去耦電容的依賴,可以將一小部分II類 MLCC(例如X5R、X6S或X7R器件)直接放置在處理器附近。目前,有些廠商正在努力將鋁聚合物去耦電容器嵌入到封裝內(nèi)的芯片載體中,與片上硅電容器一起工作,這樣可以克服高性能處理器所面臨的去耦挑戰(zhàn),并支持更高的轉(zhuǎn)換器頻率,未來可能高達(dá)10MHz。

?05、無源器件廠商的機(jī)遇

前些天,在英偉達(dá)舉辦的GTC大會(huì)上,服務(wù)器代工大廠臺(tái)達(dá)電表示,在AI服務(wù)器電源轉(zhuǎn)換系統(tǒng)中,如何在電流快速飆升下,讓電壓保持在GPU工作的0.8V,電感扮演著關(guān)鍵角色,它要能在高電流、低電壓狀態(tài)下保持穩(wěn)定工作才行。

搭載英偉達(dá)新款Blackwell架構(gòu)加速芯片的AI服務(wù)器功耗高達(dá)1000W~1200W,電感用量較一般服務(wù)器增加2~3倍,同時(shí),由于功耗明顯增加,需要的電感規(guī)格更高,使得平均單價(jià)(ASP)與一般服務(wù)器相比,高出5~8倍。.另外,由于DDR5滲透率逐步提升,必須搭配更多、更好的電感。

AI服務(wù)器的功耗顯著提升,為了改善瞬時(shí)響應(yīng)性能,需要新增TLVR電感,每臺(tái)AI服務(wù)器需新增5~10個(gè),而TLVR電感的單價(jià)是一般電感的3~5倍。

不止最新的AI服務(wù)器,越來越多的高性能計(jì)算系統(tǒng)都需要更多、更好的電感。一般服務(wù)器僅升級(jí)CPU,電感用量就會(huì)顯著增加,以Eagle Stream升級(jí)到Birch Stream為例,因?yàn)镃PU功耗提升約50%,電感用量要增加50%~70%。

可見,對(duì)于各大無源器件廠商,特別是高品質(zhì)電感企業(yè)來說,新商機(jī)就在眼前。目前,業(yè)界排名靠前的相關(guān)廠商包括TDK、國巨、順絡(luò)電子、臺(tái)慶科、ITG和EATON等。

如前文所述,在高性能計(jì)算的電源管理系統(tǒng)當(dāng)中,芯片電感的用量正在增加,這不僅對(duì)國際大廠是好消息,對(duì)中國本土相關(guān)企業(yè)來說,也將迎來提升產(chǎn)品品質(zhì)和市占率的機(jī)遇期。中國芯片電感業(yè)起步較晚,在發(fā)展初期,技術(shù)研發(fā)和生產(chǎn)管理水平都落后于國際大廠,特別是TDK、村田、奇力新和太陽誘電這幾家知名企業(yè)。最近幾年,中國本土的順絡(luò)電子一直在發(fā)力,排進(jìn)了全球前五位,此外,值得關(guān)注的本土芯片電感企業(yè)還包括鉑科新材、麥捷科技、屹通新材、天通股份、東睦股份、橫店東磁等。

?06、結(jié)語

在高性能計(jì)算系統(tǒng),特別是AI服務(wù)器的市場規(guī)模不斷擴(kuò)大的當(dāng)下,對(duì)關(guān)鍵芯片元器件的要求越來越高,不止GPU和CPU這些高性能處理器,對(duì)電源管理系統(tǒng),及其相關(guān)芯片和元器件的用量和品質(zhì)要求也有顯著提升。

作為電源管理系統(tǒng)當(dāng)中不太顯眼,但又不能缺少,且用量較大的電感和電容來說,越來越高的計(jì)算系統(tǒng)功耗,正是它們充分發(fā)揮效能和作用的舞臺(tái),相關(guān)新技術(shù)和新材料也有望不斷涌現(xiàn)出來。

對(duì)于無源器件廠商來說,具有高品質(zhì)產(chǎn)品的國家大廠依然會(huì)獲得更好的商機(jī),而對(duì)于中國本土相關(guān)企業(yè)來說,國內(nèi)的巨大市場,給了它們足夠的施展空間,有更多機(jī)會(huì)搶奪國際大廠的市場份額。

推薦器件

更多器件
器件型號(hào) 數(shù)量 器件廠商 器件描述 數(shù)據(jù)手冊(cè) ECAD模型 風(fēng)險(xiǎn)等級(jí) 參考價(jià)格 更多信息
ATXMEGA384C3-AU 1 Microchip Technology Inc IC MCU 8BIT 384KB FLASH 64TQFP

ECAD模型

下載ECAD模型
$9.28 查看
DS3234S#T&R 1 Maxim Integrated Products Real Time Clock, 1 Timer(s), CMOS, PDSO20, 0.300 INCH, ROHS COMPLIANT, SOP-20
$7.73 查看
ATXMEGA32E5-M4U 1 Microchip Technology Inc IC MCU 8BIT 32KB FLASH 32UQFN

ECAD模型

下載ECAD模型
$2.73 查看

相關(guān)推薦

電子產(chǎn)業(yè)圖譜

公眾號(hào):半導(dǎo)體產(chǎn)業(yè)縱橫。立足產(chǎn)業(yè)視角,提供及時(shí)、專業(yè)、深度的前沿洞見、技術(shù)速遞、趨勢(shì)解析,鏈接產(chǎn)業(yè)資源,構(gòu)建IC生態(tài)圈,賦能中國半導(dǎo)體產(chǎn)業(yè),我們一直在路上。