加入星計(jì)劃,您可以享受以下權(quán)益:

  • 創(chuàng)作內(nèi)容快速變現(xiàn)
  • 行業(yè)影響力擴(kuò)散
  • 作品版權(quán)保護(hù)
  • 300W+ 專業(yè)用戶
  • 1.5W+ 優(yōu)質(zhì)創(chuàng)作者
  • 5000+ 長(zhǎng)期合作伙伴
立即加入
  • 正文
    • MI300兩大系列:MI300X大型GPU、MI300A數(shù)據(jù)中心APU
    • 生成式AI領(lǐng)域,MI300X正面挑戰(zhàn)英偉達(dá)
    • 數(shù)據(jù)中心MI300A——E級(jí)APU成為現(xiàn)實(shí)
    • AI開(kāi)源軟件戰(zhàn)略持續(xù)強(qiáng)化
    • 三代產(chǎn)品演進(jìn),Lisa首談三大AI戰(zhàn)略
    • 寫(xiě)在最后
  • 推薦器件
  • 相關(guān)推薦
  • 電子產(chǎn)業(yè)圖譜
申請(qǐng)入駐 產(chǎn)業(yè)圖譜

AMD年終大秀:MI300正面挑戰(zhàn)英偉達(dá),Lisa Su首談AI三大戰(zhàn)略

2023/12/07
4506
閱讀需 12 分鐘
加入交流群
掃碼加入
獲取工程師必備禮包
參與熱點(diǎn)資訊討論

當(dāng)?shù)貢r(shí)間12月6日,在圣何塞舉辦的AMD Advancing AI活動(dòng)上,AMD CEO Lisa Su釋出重磅消息,為強(qiáng)勁的年終業(yè)績(jī)畫(huà)上一串驚嘆號(hào):盛傳許久的MI300發(fā)布;終于兌現(xiàn)E級(jí)APU承諾;在ROCm軟件領(lǐng)域取得顯著進(jìn)步,硬剛CUDA的薄弱環(huán)節(jié)繼續(xù)得以強(qiáng)化。

隨著生成式AI的快速發(fā)展,全球高性能計(jì)算需求不斷增加,進(jìn)一步推動(dòng)了AI芯片的激烈競(jìng)爭(zhēng)。以微軟、Meta為首的大型云廠商也在尋求自研AI芯片或支持新的供應(yīng)商,來(lái)降低對(duì)英偉達(dá)的依賴。AMD MI300 推出后,微軟、Meta就在首批客戶之列。

MI300兩大系列:MI300X大型GPU、MI300A數(shù)據(jù)中心APU

在英偉達(dá)占據(jù)絕對(duì)地位的AI芯片領(lǐng)域中,AMD是為數(shù)不多具備可訓(xùn)練和部署AI的高端GPU公司之一,業(yè)界將其定位為生成式AI和大規(guī)模AI系統(tǒng)的可靠替代者。AMD與英偉達(dá)展開(kāi)競(jìng)爭(zhēng)的戰(zhàn)略之一,就包括功能強(qiáng)大的MI300系列加速芯片。當(dāng)前,AMD 正在通過(guò)更強(qiáng)大的 GPU、以及創(chuàng)新的CPU+GPU平臺(tái)直接挑戰(zhàn)英偉達(dá)H100的主導(dǎo)地位。

Lisa Su在開(kāi)場(chǎng)演講中談到,包括GPU、FPGA等在內(nèi)的數(shù)據(jù)中心加速芯片,未來(lái)四年每年將以50%以上的速度增長(zhǎng),從2023年的300億市場(chǎng)規(guī)模,到2027年將超過(guò)1500億。她表示,從業(yè)多年,這種創(chuàng)新速度比她以往見(jiàn)到的任何技術(shù)都快。

最新發(fā)布的MI300目前包括兩大系列,MI300X系列是一款大型GPU,擁有領(lǐng)先的生成式AI所需的內(nèi)存帶寬、大語(yǔ)言模型所需的訓(xùn)練和推理性能;MI300A系列集成CPU+GPU,基于最新的CDNA 3架構(gòu)和Zen 4 CPU,可以為HPC和AI工作負(fù)載提供突破性能。毫無(wú)疑問(wèn),MI300不僅僅是新一代AI加速芯片,也是AMD對(duì)下一代高性能計(jì)算的愿景。

生成式AI領(lǐng)域,MI300X正面挑戰(zhàn)英偉達(dá)

AMD MI300X 擁有最多 8 個(gè) XCD 核心,304 組 CU 單元,8 組 HBM3 核心,內(nèi)存容量最大可達(dá) 192GB,相當(dāng)于英偉達(dá)H100(80GB)的2.4 倍,同時(shí)HBM內(nèi)存帶寬高達(dá)5.3TB/s,Infinity Fabric總線帶寬896GB/s。擁有大量板載內(nèi)存的優(yōu)點(diǎn)是,只需更少的GPU 來(lái)運(yùn)行內(nèi)存中的大模型,省去跨越更多GPU的功耗和硬件成本。

Lisa Su表示,生成式AI是有史以來(lái)要求最高的工作負(fù)載,需要成千上萬(wàn)的加速器來(lái)訓(xùn)練和完善數(shù)十億參數(shù)的模型。它的“法則”非常簡(jiǎn)單,你擁有的計(jì)算越多,模型的能力越強(qiáng),生成答案的速度就越快。

“GPU是生成式AI世界的中心。每個(gè)與我交談的人都說(shuō),GPU計(jì)算的可用性和能力是AI采用的一個(gè)最重要的因素”,她興奮地表示,“MI300X是我們迄今為止最先進(jìn)的產(chǎn)品,也是業(yè)內(nèi)最先進(jìn)的AI加速芯片?!?/p>

Instinct平臺(tái)是基于OCP標(biāo)準(zhǔn)設(shè)計(jì)的生成式AI平臺(tái),包括8個(gè)MI300X,可以提供1.5TB HBM3內(nèi)存容量。與英偉達(dá)H100 HGX相比,AMD Instinct平臺(tái)可以提供更高的吞吐量,例如運(yùn)行176B的 BLOOM 等LLM推理時(shí),性能提升高達(dá) 1.6 倍,并且是當(dāng)前市場(chǎng)上唯一的能夠?qū)?70B 參數(shù)模型(如 Llama2)進(jìn)行推理的方案。

此外,AMD宣布了與微軟Azure等合作,通過(guò)將尖端的AI硬件集成到領(lǐng)先的云平臺(tái)中,也標(biāo)志著當(dāng)前業(yè)界人工智能應(yīng)用的持續(xù)進(jìn)步。而在 Azure 生態(tài)系統(tǒng)中引入 AMD Instinct MI300X,也進(jìn)一步鞏固了AMD在云端AI的市場(chǎng)地位。

數(shù)據(jù)中心MI300A——E級(jí)APU成為現(xiàn)實(shí)

MI300A 是全球首款適用于HPC和AI的數(shù)據(jù)中心APU,結(jié)合了CDNA 3 GPU內(nèi)核、最新的基于AMD“Zen 4” x86的CPU內(nèi)核、以及128GB HBM3 內(nèi)存,通過(guò)3D封裝和第四代AMD Infinity架構(gòu),可提供HPC和AI工作負(fù)載所需的性能。與上一代 AMD Instinct MI250X5 相比,運(yùn)行HPC和AI工作負(fù)載,F(xiàn)P32每瓦性能為1.9 倍。

能源效率對(duì)于HPC和AI領(lǐng)域至關(guān)重要,因?yàn)檫@些應(yīng)用中充斥著數(shù)據(jù)和資源極其密集的工作負(fù)載。MI300A APU將CPU和GPU核心集成在一個(gè)封裝中,可提供高效的平臺(tái),同時(shí)還可提供加速最新的AI模型所需的訓(xùn)練性能。在AMD內(nèi)部,能源效率的創(chuàng)新目標(biāo)定位為30×25,即2020-2025年,將服務(wù)器處理器和AI加速器的能效提高30倍。

對(duì)比MI300X的8個(gè)XCD核心,MI300A采用6個(gè)XCD,從而為CCD留出空間。APU的優(yōu)勢(shì)意味著,它擁有統(tǒng)一的共享內(nèi)存和緩存資源,因此省去了在CPU和GPU之間來(lái)回復(fù)制數(shù)據(jù)。切換電源時(shí),它只需運(yùn)行GPU,在CPU上運(yùn)行串行部分即可,由于省去復(fù)制數(shù)據(jù)的過(guò)程,因此性能表現(xiàn)更好。同時(shí)也可以為客戶提供易于編程的GPU平臺(tái)、高性能的計(jì)算、快速的AI訓(xùn)練能力和良好的能源效率,能夠?yàn)樾枨髧?yán)苛的HPC和AI工作負(fù)載提供動(dòng)力。

美國(guó)即將推出的新一代 2ExaFLOPS (200億億次)的El Capitan超算將采用AMD MI300A,這將使得El Capitan成為世界上最快的超級(jí)計(jì)算機(jī)。

AI開(kāi)源軟件戰(zhàn)略持續(xù)強(qiáng)化

AMD 發(fā)布了最新的ROCm 6開(kāi)放軟件平臺(tái),也是AMD對(duì)開(kāi)源社區(qū)貢獻(xiàn)最先進(jìn)的庫(kù)的承諾。Lisa Su表示,ROCm 6代表AMD軟件工具的重大飛躍,進(jìn)一步推進(jìn)了AMD開(kāi)源AI軟件開(kāi)發(fā)的愿景。該軟件平臺(tái)增強(qiáng)了AMD的AI加速性能,在 MI300 系列加速器上運(yùn)行Llama 2 文本生成時(shí),與上一代硬件和軟件相比,性能提高約8倍。

針對(duì)生成式AI,ROCm 6增加了關(guān)鍵功能:包括 FlashAttention、HIPGraph 和 vLLM等。 AMD正在在與軟件伙伴推進(jìn)合作,例如PyTorch、TensorFlow、hugging face等,打造強(qiáng)大的AI生態(tài)系統(tǒng),簡(jiǎn)化AMD AI 解決方案的部署。

此外,AMD 還通過(guò)收購(gòu)開(kāi)源軟件公司Nod.AI,進(jìn)一步增強(qiáng)為AI客戶提供開(kāi)放軟件的能力,使他們能夠輕松部署針對(duì)AMD硬件調(diào)整的高性能AI模型。并且通過(guò)與Mipsology的生態(tài)系統(tǒng)合作等,持續(xù)強(qiáng)化其開(kāi)源的AI軟件戰(zhàn)略。

AMD致力于建立一個(gè)開(kāi)放的軟件生態(tài)系統(tǒng),利用廣泛的開(kāi)源社區(qū)基礎(chǔ)來(lái)加快創(chuàng)新步伐,同時(shí)為客戶提供更多的靈活性。不得不說(shuō),對(duì)標(biāo)英偉達(dá)在AI領(lǐng)域強(qiáng)大的CUDA生態(tài),此舉是AMD將其自身打造為有力的AI競(jìng)爭(zhēng)者的關(guān)鍵環(huán)節(jié),也有助于AMD切入CUDA現(xiàn)有的市場(chǎng)。

三代產(chǎn)品演進(jìn),Lisa首談三大AI戰(zhàn)略

前不久,AMD在公布2023年Q3財(cái)報(bào)時(shí),預(yù)計(jì)到 2024 年數(shù)據(jù)中心 GPU 收入將超過(guò)20 億美元,實(shí)現(xiàn)大幅增長(zhǎng)。當(dāng)時(shí),這種加速的收入預(yù)測(cè)主要取決于以AI為中心的解決方案,能夠滿足跨行業(yè)的各種AI工作負(fù)載的能力,這也是最新推出的MI300獲得業(yè)界高度關(guān)注的一個(gè)原因。

AMD的加速芯片之旅,始于第一代基于CDNA計(jì)算架構(gòu)的MI100,通過(guò)一些HPC的應(yīng)用和部署,為MI200取得更廣泛的商業(yè)成功鋪平了道路。MI200量產(chǎn)出貨已有幾年,在大型HPC和前沿AI部署應(yīng)用方面收獲頗豐,并且是超級(jí)計(jì)算機(jī)500強(qiáng)榜單的第一名。

也正是經(jīng)過(guò)這兩代產(chǎn)品的打磨,使AMD真正對(duì)AI工作負(fù)載、軟件需求等有了更深入的理解,為MI300打下了堅(jiān)實(shí)基礎(chǔ)。當(dāng)前,MI300A主要專注于HPC和AI應(yīng)用,是全球首個(gè)數(shù)據(jù)中心APU。MI300X則專為生成式AI而設(shè)計(jì),通過(guò)硬件和軟件全面提升,使得該產(chǎn)品的應(yīng)用門(mén)檻進(jìn)一步降低。

Lisa Su在大會(huì)上首次談到了AMD的三大AI戰(zhàn)略:首先,AMD始終提供通用的、高性能的、節(jié)能的GPU、CPU和用于AI訓(xùn)練和推理的計(jì)算方案;其次,將繼續(xù)擴(kuò)展開(kāi)放、成熟和對(duì)開(kāi)發(fā)人員友好的軟件平臺(tái),使得領(lǐng)先的AI框架、庫(kù)和模型都完全支持AMD硬件;第三,AMD將與合作伙伴擴(kuò)大聯(lián)合創(chuàng)新,包括云提供商、OEM、軟件開(kāi)發(fā)人員等等,實(shí)現(xiàn)更進(jìn)一步的AI加速創(chuàng)新。

寫(xiě)在最后

AMD此次推出MI300是其發(fā)展歷程中的一個(gè)重要里程碑。 通過(guò)比英偉達(dá)H100更優(yōu)的一系列表現(xiàn),AMD致力于成為生成式AI時(shí)代的有力競(jìng)爭(zhēng)者。

隨著重磅產(chǎn)品的問(wèn)世,大客戶合作是否會(huì)助力AMD加速追趕?AMD能否抓住AI時(shí)代機(jī)遇,復(fù)刻CPU成功之路?在高端GPU領(lǐng)域,英偉達(dá)已經(jīng)先發(fā)制人,AMD能否成為游戲規(guī)則改變者?

短期內(nèi)可以看到的是,隨著英偉達(dá)明年推出H200和B100兩款芯片,高端AI芯片的競(jìng)爭(zhēng)態(tài)勢(shì)繼續(xù)膠著,AI加速計(jì)算有望開(kāi)啟新一輪超級(jí)周期。

至于AMD是否有計(jì)劃開(kāi)發(fā)和銷售能夠符合美國(guó)對(duì)華芯片出口禁令的特定版本的MI 300?就在本文發(fā)稿前,AMD方面回應(yīng):中國(guó)市場(chǎng)對(duì)AMD很重要,但今天沒(méi)有宣布專門(mén)針對(duì)中國(guó)市場(chǎng)的特別產(chǎn)品。

推薦器件

更多器件
器件型號(hào) 數(shù)量 器件廠商 器件描述 數(shù)據(jù)手冊(cè) ECAD模型 風(fēng)險(xiǎn)等級(jí) 參考價(jià)格 更多信息
MK10DX256VLH7R 1 Freescale Semiconductor Kinetis K 32-bit MCU, ARM Cortex-M4 core, 256KB Flash, 72MHz, QFP 64
$9.1 查看
ATXMEGA128A4U-AU 1 Microchip Technology Inc IC MCU 8BIT 128KB FLASH 44TQFP

ECAD模型

下載ECAD模型
$4.91 查看
DS3234SN# 1 Maxim Integrated Products Real Time Clock, Non-Volatile, 1 Timer(s), CMOS, PDSO20, 0.300 INCH, ROHS COMPLIANT, SOP-20
$10.19 查看
AMD

AMD

AMD公司成立于1969年,總部位于美國(guó)加利福尼亞州桑尼維爾。AMD(NYSE: AMD)是一家創(chuàng)新的科技公司,致力于與客戶及合作伙伴緊密合作,開(kāi)發(fā)下一代面向商用、家用和游戲領(lǐng)域的計(jì)算和圖形處理解決方案。

AMD公司成立于1969年,總部位于美國(guó)加利福尼亞州桑尼維爾。AMD(NYSE: AMD)是一家創(chuàng)新的科技公司,致力于與客戶及合作伙伴緊密合作,開(kāi)發(fā)下一代面向商用、家用和游戲領(lǐng)域的計(jì)算和圖形處理解決方案。收起

查看更多

相關(guān)推薦

電子產(chǎn)業(yè)圖譜

與非網(wǎng)資深行業(yè)分析師。主要關(guān)注人工智能、智能消費(fèi)電子等領(lǐng)域。電子科技領(lǐng)域?qū)I(yè)媒體十余載,善于縱深洞悉行業(yè)趨勢(shì)。歡迎交流~