国产原创一区二区,77777在线视频免费播放

作者|Jimmy&淺土&大藍(lán)

當(dāng)?shù)貢r(shí)間6月13日，CPU和GPU領(lǐng)域的“千年老二”AMD舉行了新品發(fā)布會(huì)，推出最新強(qiáng)悍GPU，叫板GPU老大英偉達(dá)。

沉寂已久的服務(wù)器領(lǐng)域近乎開(kāi)了場(chǎng)春晚，之所以這么引人關(guān)注，還是因?yàn)榻衲甏蠡鸬?a class="article-link" target="_blank" href="/tag/ChatGPT/">ChatGPT將人工智能再度推上風(fēng)口浪尖，英偉達(dá)GPU變成AI玩家們爭(zhēng)奪算力的搶手金磚，A100價(jià)格從去年12月一路上漲，5個(gè)月價(jià)格累計(jì)漲幅達(dá)到37.5%，同期其閹割版的A800價(jià)格累計(jì)漲幅達(dá)20.0%。

最大贏家英偉達(dá)前不久股價(jià)破萬(wàn)億美元，而在這場(chǎng)發(fā)布會(huì)的前幾天，AMD股價(jià)漲近10%，給AMD追趕英偉達(dá)多了幾分氣氛的烘托。

作為人工智能領(lǐng)域的王者，英偉達(dá)站在巔峰多時(shí)。這次AMD專為生成式AI 打造的GPU會(huì)對(duì)原有市場(chǎng)造成影響嗎？AI大火的時(shí)候，為什么很少見(jiàn)到AMD的身影？

01、1530億晶體管！MI300對(duì)標(biāo)H100

此次發(fā)布會(huì)上，AMD帶來(lái)了Instinct MI300系列的產(chǎn)品更多細(xì)節(jié)和更新、第四代的Epyc產(chǎn)品的更新，以及預(yù)告了之后將推出全新DPU芯片。不過(guò)，最矚目的還是當(dāng)屬用于訓(xùn)練大模型的最先進(jìn)GPU Instinct MI300。

近期，AI熱度不減，英偉達(dá)憑借最新的超算以及以H100為首的高性能GPU，成功奪下AI王冠。排名第二的AMD的CEO蘇姿豐此前就曾放話表示，要從英偉達(dá)手中奪下AI王冠，此次所推出的MI300正是AMD搶奪AI市場(chǎng)的首輪攻勢(shì)。

MI300系列是AMD為AI和高性能計(jì)算（HPC）打造的一系列最新APU加速卡，此次發(fā)布了該系列兩款新芯片，MI300A是全球首款面向AI和HPC的APU，在設(shè)計(jì)上同時(shí)集成了CPU和GPU；MI300X是純GPU版本，采用了8 個(gè) GPU chiplet（基于CDNA 3架構(gòu)）和另外 4 個(gè) IO 內(nèi)存chiplet的設(shè)計(jì)。簡(jiǎn)單來(lái)說(shuō)，MI300A是“基礎(chǔ)款”，MI300X則是硬件性能更高的“大模型優(yōu)化款”。

MI300X是一款專門(mén)面向生成式AI推出的加速器，對(duì)標(biāo)英偉達(dá)H100。這款加速器全部采用GPU，集成的晶體管數(shù)量達(dá)到了驚人的1530億！并且，為了緩解AI大型語(yǔ)言模型?(LLM)?所面臨的內(nèi)存制約，AMD為這款芯片集成了192GB的HBM3，其存儲(chǔ)帶寬也高達(dá)5.2TB/s，可以處理的參數(shù)高達(dá)400億。

和H100相比，MI300X的高帶寬內(nèi)存（HBM）密度，最高可達(dá)英偉達(dá)H100的2.4倍，高帶寬內(nèi)存帶寬最高可達(dá)H100的1.6倍。也就是說(shuō)，MI300X能運(yùn)行比H100更大的AI模型。

蘇姿豐現(xiàn)場(chǎng)展示了MI300X運(yùn)行包括GPT-3、PaLM2等大模型的優(yōu)勢(shì)，并在單個(gè)MI300X?GPU上運(yùn)行擁有400億個(gè)參數(shù)的Falcon-40B大型語(yǔ)言模型，讓它寫(xiě)了一首關(guān)于舊金山的詩(shī)。這是全球首次在單個(gè)GPU上運(yùn)行這么大的模型。大模型所需要的GPU越少，開(kāi)發(fā)者的成本也越小。

另一款MI300A，號(hào)稱全球首款針對(duì)AI和高性能計(jì)算（HPC）的加速處理器（APU）加速器，在13個(gè)小芯片中遍布1460億個(gè)晶體管。它采用CDNA 3 GPU架構(gòu)和24個(gè)Zen 4 CPU內(nèi)核，配置128GB的HBM3內(nèi)存。相比前代MI250，MI300的性能提高八倍，效率提高五倍。外媒seminalysis表示，“這是迄今為止市場(chǎng)上最好的HPC芯片，并將保持一段時(shí)間?！?/p>

AMD還發(fā)布了AMD Instinct 平臺(tái)，它擁有八個(gè)MI300X，采用行業(yè)標(biāo)準(zhǔn)OCP設(shè)計(jì)，提供總計(jì)1.5TB的HBM3內(nèi)存。

蘇姿豐表示，MI300A已經(jīng)出樣，MI300X和八個(gè)GPU的Instinct 平臺(tái)將在今年第三季度出樣，第四季度正式推出。

02、大火的AI模型怎么不見(jiàn)AMD？

雖然AMD看起來(lái)并不像是慢半拍的樣子，這幾年動(dòng)作也頻頻。去年推出了專為數(shù)據(jù)中心設(shè)計(jì)的MI200系列GPU，還拿下了Meta數(shù)據(jù)中心的訂單。但今年ChatGPT大火后，被人熱議的始終只有英偉達(dá)，連帶著與英偉達(dá)GPU相關(guān)的服務(wù)器都在漲價(jià)，而英偉達(dá)也緊急向臺(tái)積電追加訂單，似乎它們也并未料到，這一波熱度是如此來(lái)勢(shì)洶洶。

所以AMD的存在感呢？

如果只從硬件方面看，AMD并沒(méi)有比英偉達(dá)差多少，各種紙面參數(shù)對(duì)比，AMD也沒(méi)有落下風(fēng)。但從人工智能應(yīng)用上看，或者說(shuō)現(xiàn)在流行的大模型，硬件就只是基礎(chǔ)。

我們常說(shuō)人工智能的三要素：算力、算法、數(shù)據(jù)，芯片是算力的來(lái)源，算力的強(qiáng)與弱決定了你要耗費(fèi)多少時(shí)間，或者你要耗費(fèi)多少疊加算力的成本來(lái)完成訓(xùn)練模型，但很多時(shí)候軟件層面的優(yōu)化，會(huì)使效果事半功倍。

這就好比你玩游戲一樣，硬件再好，優(yōu)化很差，照樣卡成PPT。

所以為了方便開(kāi)發(fā)人員編程，英偉達(dá)和AMD都有自己的加速平臺(tái)（CUDA和ROCm），而以此打造的生態(tài)，是它們之間差異的所在，也是這場(chǎng)大模型初期的博弈中，英偉達(dá)占據(jù)上風(fēng)的關(guān)鍵。

CUDA是英偉達(dá)的一種通用并行計(jì)算平臺(tái)和編程模型，它通過(guò)利用GPU的處理能力，可大幅提升計(jì)算性能。CUDA使英偉達(dá)的GPU能夠執(zhí)行使用C、C++、Fortran、OpenCL、DirectCompute和其他語(yǔ)言編寫(xiě)的程序。

在CUDA問(wèn)世之前，對(duì)GPU編程必須要編寫(xiě)大量的底層語(yǔ)言代碼，而CUDA可以讓普通程序員可以利用C語(yǔ)言、C++等為CUDA架構(gòu)編寫(xiě)程序在GPU平臺(tái)上進(jìn)行大規(guī)模并行計(jì)算，在全球GPGPU開(kāi)發(fā)市場(chǎng)占比已超過(guò)80%。GPGPU與CUDA組成的軟硬件底座，構(gòu)成了英偉達(dá)引領(lǐng)AI計(jì)算及數(shù)據(jù)中心領(lǐng)域的根基。

AMD的ROCm是基于開(kāi)源項(xiàng)目編寫(xiě)，其生態(tài)采取HIP編程模型，但HIP與 CUDA的編程語(yǔ)法極為相似，開(kāi)發(fā)者可以模仿CUDA的編程方式為AMD的GPU產(chǎn)品編程，從而在源代碼層面上兼容CUDA。所以從本質(zhì)上來(lái)看，ROCm 生態(tài)只是借用了CUDA的技術(shù)，無(wú)法真正替代CUDA產(chǎn)生壁壘。

與ROCm的開(kāi)源基礎(chǔ)不同，CUDA的誕生就只是為了英偉達(dá)自家GPU服務(wù)，甚至它走在H100、A100等明星產(chǎn)品前，早在2007年英偉達(dá)就推出了CUDA，發(fā)展至今已經(jīng)相當(dāng)成熟，深受開(kāi)發(fā)者的喜愛(ài)，目前主流的深度學(xué)習(xí)框架都使用CUDA，也就是說(shuō)現(xiàn)在的AI大模型幾乎都無(wú)法避開(kāi)CUDA，所以訓(xùn)練大模型自然而然首先想到的是英偉達(dá)，而英偉達(dá)也基于此打了一套自家產(chǎn)品的組合拳，屬于軟件帶領(lǐng)硬件發(fā)家致富。

但AMD沒(méi)有機(jī)會(huì)了嗎？并不是。

基于CDNA架構(gòu)的AMD GPU是可以跑GPT大模型的，在這次發(fā)布會(huì)上，蘇姿豐也展示了MI300系列跑GPT等大模型的效果，紙面參數(shù)也要高于H100。更重要的是，AMD在會(huì)上宣布了與Hugging Face建立合作關(guān)系。

Hugging Face是人工智能獨(dú)角獸企業(yè)，在機(jī)器學(xué)習(xí)領(lǐng)域的開(kāi)發(fā)者肯定不陌生。自從一家NLP公司轉(zhuǎn)型成為一家即用型機(jī)器學(xué)習(xí)模型平臺(tái)后，Hugging Face已經(jīng)托管了10萬(wàn)個(gè)預(yù)訓(xùn)練模型和1萬(wàn)個(gè)數(shù)據(jù)集，有超1萬(wàn)家企業(yè)正在使用該平臺(tái)構(gòu)建機(jī)器學(xué)習(xí)技術(shù)。

AMD與它的合作無(wú)疑是在補(bǔ)齊生態(tài)上的短板，這也是AMD最難跨越英偉達(dá)的一道坎，畢竟英偉達(dá)已經(jīng)苦心經(jīng)營(yíng)很久，AMD明顯算是后來(lái)者，苦于沒(méi)有應(yīng)用案例，未來(lái)或許會(huì)有專門(mén)針對(duì)ROCm的大模型出現(xiàn)，只能說(shuō)AMD終于在機(jī)器學(xué)習(xí)領(lǐng)域亮了劍。

03、GPU緊缺會(huì)緩解嗎？會(huì)沖擊英偉達(dá)的市場(chǎng)？

從長(zhǎng)遠(yuǎn)來(lái)看，AMD會(huì)有一席之地，一方面整個(gè)通用GPU市場(chǎng)，除了英偉達(dá)就是AMD了，而機(jī)器學(xué)習(xí)只是個(gè)開(kāi)始，未來(lái)人工智能和服務(wù)器及超算市場(chǎng)足夠龐大，AMD有能力去爭(zhēng)奪。另一方面，整個(gè)GPU及服務(wù)器市場(chǎng)已經(jīng)出現(xiàn)供不應(yīng)求的場(chǎng)面了，而下游應(yīng)用企業(yè)不會(huì)坐以待斃，站在風(fēng)口上，誰(shuí)速度快，誰(shuí)才有市場(chǎng)。

5月英偉達(dá)GPU的交期再次拉長(zhǎng)，基本需要三個(gè)月或更長(zhǎng)，部分新訂單“可能要到12月才能交付”，就連特供中國(guó)的A800（A100閹割版）都在市場(chǎng)上被炒到10萬(wàn)一塊，國(guó)內(nèi)字節(jié)跳動(dòng)等互聯(lián)網(wǎng)大廠紛紛找英偉達(dá)下大單，爭(zhēng)奪AI入場(chǎng)券。

在英偉達(dá)供應(yīng)緊缺的情況下，自然會(huì)有人想用其他方式來(lái)實(shí)現(xiàn)，這不，微軟已經(jīng)找上AMD來(lái)合作開(kāi)發(fā)人工智能芯片，目的就是為了尋找另一條路徑，縱觀整個(gè)通用GPU市場(chǎng)，大概只有AMD還有這樣的潛力。

但短期來(lái)看，AMD不太會(huì)緩解現(xiàn)在GPU供應(yīng)緊張的狀態(tài)。

首先，MI300系列正式推出要等到下半年，甚至到第四季度，各種基準(zhǔn)測(cè)試的結(jié)果都還沒(méi)披露，實(shí)際性能到底如何還不知道。

其次，AMD使用的也是臺(tái)積電的CoWoS先進(jìn)封裝。目前臺(tái)積電的產(chǎn)能已經(jīng)告急，英偉達(dá)和AMD合計(jì)占據(jù)了7-8成的產(chǎn)能，臺(tái)積電預(yù)計(jì)到2024年底擴(kuò)產(chǎn)到每月20000片產(chǎn)能，但光英偉達(dá)就要消耗預(yù)計(jì)一半的產(chǎn)能，AMD也在嘗試為明年預(yù)訂額外的產(chǎn)能，所以同樣都面臨著產(chǎn)能問(wèn)題。

最后，訓(xùn)練一個(gè)大模型要耗費(fèi)大量的時(shí)間和成本，業(yè)內(nèi)分析，MI300的封裝技術(shù)相當(dāng)復(fù)雜，成本不見(jiàn)得比英偉達(dá)有優(yōu)勢(shì)，況且現(xiàn)在臺(tái)積電產(chǎn)能緊缺，AMD供貨能力有多少也并不清楚。要推出一個(gè)基于AMD架構(gòu)的模型，并以此打開(kāi)新的市場(chǎng)，需要一定的時(shí)間，還得有人愿意為ROCm生態(tài)貢獻(xiàn)自己一份力。

發(fā)布會(huì)上，AMD并沒(méi)有透露誰(shuí)計(jì)劃使用這些芯片，發(fā)布會(huì)結(jié)束后，AMD的股價(jià)不漲反跌，也反映了市場(chǎng)對(duì)AMD的情緒。

04、總結(jié)

目前英偉達(dá)擁有超過(guò)80%的市場(chǎng)份額，占據(jù)人工智能芯片市場(chǎng)的主導(dǎo)地位。國(guó)外主流媒體與分析師似乎不太看好AMD這次與英偉達(dá)的較量，他們認(rèn)為，AMD不透露售價(jià)，也不透露客戶，或許會(huì)讓華爾街失望，雖然對(duì)于微軟、亞馬遜等急著用芯片的企業(yè)，AMD是不二的選擇，但這并不意味著能搶走英偉達(dá)多少市場(chǎng)份額，

蘇姿豐可能會(huì)回想起加入AMD后受到顧問(wèn)質(zhì)疑的時(shí)刻，就像此刻她面對(duì)整個(gè)華爾街質(zhì)疑的時(shí)候一樣。后來(lái)蘇姿豐帶領(lǐng)AMD走出低谷，從瀕死到涅槃，她創(chuàng)造了一個(gè)神話。

在近期的福布斯采訪中，蘇姿豐說(shuō)道：“如果你展望未來(lái)五年，你會(huì)看到AMD的每款產(chǎn)品都有AI的影子，它將成為最大的增長(zhǎng)驅(qū)動(dòng)因素?！?/p>

重生過(guò)后的AMD要翻越另一座大山，蘇姿豐能再一次創(chuàng)造神話嗎？

器件型號(hào)	數(shù)量	器件廠商	器件描述	ECAD模型	參考價(jià)格	更多信息
MK64FN1M0VLL12R	1	NXP Semiconductors	FLASH, 120MHz, RISC MICROCONTROLLER, PQFP100		暫無(wú)數(shù)據(jù)	查看
MKL02Z16VFG4	1	NXP Semiconductors	RISC MICROCONTROLLER		$2.9	查看
ATSAMD20J18A-AUT	1	Microchip Technology Inc	IC MCU 32BIT 256KB FLASH 64LQFP	ECAD模型下載ECAD模型	$4.06	查看

器件型號(hào)

數(shù)量

器件廠商

器件描述

數(shù)據(jù)手冊(cè)

ECAD模型

風(fēng)險(xiǎn)等級(jí)

參考價(jià)格

更多信息

MK64FN1M0VLL12R

NXP Semiconductors

FLASH, 120MHz, RISC MICROCONTROLLER, PQFP100