久久99热这里只有,又大又硬又粗又黄的免费视频

當(dāng)?shù)貢r(shí)間12月6日，在圣何塞舉辦的AMD Advancing AI活動(dòng)上，AMD CEO Lisa Su釋出重磅消息，為強(qiáng)勁的年終業(yè)績(jī)畫(huà)上一串驚嘆號(hào)：盛傳許久的MI300發(fā)布；終于兌現(xiàn)E級(jí)APU承諾；在ROCm軟件領(lǐng)域取得顯著進(jìn)步，硬剛CUDA的薄弱環(huán)節(jié)繼續(xù)得以強(qiáng)化。

隨著生成式AI的快速發(fā)展，全球高性能計(jì)算需求不斷增加，進(jìn)一步推動(dòng)了AI芯片的激烈競(jìng)爭(zhēng)。以微軟、Meta為首的大型云廠商也在尋求自研AI芯片或支持新的供應(yīng)商，來(lái)降低對(duì)英偉達(dá)的依賴。AMD MI300 推出后，微軟、Meta就在首批客戶之列。

MI300兩大系列：MI300X大型GPU、MI300A數(shù)據(jù)中心APU

在英偉達(dá)占據(jù)絕對(duì)地位的AI芯片領(lǐng)域中，AMD是為數(shù)不多具備可訓(xùn)練和部署AI的高端GPU公司之一，業(yè)界將其定位為生成式AI和大規(guī)模AI系統(tǒng)的可靠替代者。AMD與英偉達(dá)展開(kāi)競(jìng)爭(zhēng)的戰(zhàn)略之一，就包括功能強(qiáng)大的MI300系列加速芯片。當(dāng)前，AMD 正在通過(guò)更強(qiáng)大的 GPU、以及創(chuàng)新的CPU+GPU平臺(tái)直接挑戰(zhàn)英偉達(dá)H100的主導(dǎo)地位。

Lisa Su在開(kāi)場(chǎng)演講中談到，包括GPU、FPGA等在內(nèi)的數(shù)據(jù)中心加速芯片，未來(lái)四年每年將以50%以上的速度增長(zhǎng)，從2023年的300億市場(chǎng)規(guī)模，到2027年將超過(guò)1500億。她表示，從業(yè)多年，這種創(chuàng)新速度比她以往見(jiàn)到的任何技術(shù)都快。

最新發(fā)布的MI300目前包括兩大系列，MI300X系列是一款大型GPU，擁有領(lǐng)先的生成式AI所需的內(nèi)存帶寬、大語(yǔ)言模型所需的訓(xùn)練和推理性能；MI300A系列集成CPU+GPU，基于最新的CDNA 3架構(gòu)和Zen 4 CPU，可以為HPC和AI工作負(fù)載提供突破性能。毫無(wú)疑問(wèn)，MI300不僅僅是新一代AI加速芯片，也是AMD對(duì)下一代高性能計(jì)算的愿景。

生成式AI領(lǐng)域，MI300X正面挑戰(zhàn)英偉達(dá)

AMD MI300X 擁有最多 8 個(gè) XCD 核心，304 組 CU 單元，8 組 HBM3 核心，內(nèi)存容量最大可達(dá) 192GB，相當(dāng)于英偉達(dá)H100（80GB）的2.4 倍，同時(shí)HBM內(nèi)存帶寬高達(dá)5.3TB/s，Infinity Fabric總線帶寬896GB/s。擁有大量板載內(nèi)存的優(yōu)點(diǎn)是，只需更少的GPU 來(lái)運(yùn)行內(nèi)存中的大模型，省去跨越更多GPU的功耗和硬件成本。

Lisa Su表示，生成式AI是有史以來(lái)要求最高的工作負(fù)載，需要成千上萬(wàn)的加速器來(lái)訓(xùn)練和完善數(shù)十億參數(shù)的模型。它的“法則”非常簡(jiǎn)單，你擁有的計(jì)算越多，模型的能力越強(qiáng)，生成答案的速度就越快。

“GPU是生成式AI世界的中心。每個(gè)與我交談的人都說(shuō)，GPU計(jì)算的可用性和能力是AI采用的一個(gè)最重要的因素”，她興奮地表示，“MI300X是我們迄今為止最先進(jìn)的產(chǎn)品，也是業(yè)內(nèi)最先進(jìn)的AI加速芯片?！?/p>

Instinct平臺(tái)是基于OCP標(biāo)準(zhǔn)設(shè)計(jì)的生成式AI平臺(tái)，包括8個(gè)MI300X，可以提供1.5TB HBM3內(nèi)存容量。與英偉達(dá)H100 HGX相比，AMD Instinct平臺(tái)可以提供更高的吞吐量，例如運(yùn)行176B的 BLOOM 等LLM推理時(shí)，性能提升高達(dá) 1.6 倍，并且是當(dāng)前市場(chǎng)上唯一的能夠?qū)?70B 參數(shù)模型（如 Llama2）進(jìn)行推理的方案。

此外，AMD宣布了與微軟Azure等合作，通過(guò)將尖端的AI硬件集成到領(lǐng)先的云平臺(tái)中，也標(biāo)志著當(dāng)前業(yè)界人工智能應(yīng)用的持續(xù)進(jìn)步。而在 Azure 生態(tài)系統(tǒng)中引入 AMD Instinct MI300X，也進(jìn)一步鞏固了AMD在云端AI的市場(chǎng)地位。

數(shù)據(jù)中心MI300A——E級(jí)APU成為現(xiàn)實(shí)

MI300A 是全球首款適用于HPC和AI的數(shù)據(jù)中心APU，結(jié)合了CDNA 3 GPU內(nèi)核、最新的基于AMD“Zen 4” x86的CPU內(nèi)核、以及128GB HBM3 內(nèi)存，通過(guò)3D封裝和第四代AMD Infinity架構(gòu)，可提供HPC和AI工作負(fù)載所需的性能。與上一代 AMD Instinct MI250X5 相比，運(yùn)行HPC和AI工作負(fù)載，F(xiàn)P32每瓦性能為1.9 倍。

能源效率對(duì)于HPC和AI領(lǐng)域至關(guān)重要，因?yàn)檫@些應(yīng)用中充斥著數(shù)據(jù)和資源極其密集的工作負(fù)載。MI300A APU將CPU和GPU核心集成在一個(gè)封裝中，可提供高效的平臺(tái)，同時(shí)還可提供加速最新的AI模型所需的訓(xùn)練性能。在AMD內(nèi)部，能源效率的創(chuàng)新目標(biāo)定位為30×25，即2020-2025年，將服務(wù)器處理器和AI加速器的能效提高30倍。

對(duì)比MI300X的8個(gè)XCD核心，MI300A采用6個(gè)XCD，從而為CCD留出空間。APU的優(yōu)勢(shì)意味著，它擁有統(tǒng)一的共享內(nèi)存和緩存資源，因此省去了在CPU和GPU之間來(lái)回復(fù)制數(shù)據(jù)。切換電源時(shí)，它只需運(yùn)行GPU，在CPU上運(yùn)行串行部分即可，由于省去復(fù)制數(shù)據(jù)的過(guò)程，因此性能表現(xiàn)更好。同時(shí)也可以為客戶提供易于編程的GPU平臺(tái)、高性能的計(jì)算、快速的AI訓(xùn)練能力和良好的能源效率，能夠?yàn)樾枨髧?yán)苛的HPC和AI工作負(fù)載提供動(dòng)力。

美國(guó)即將推出的新一代 2ExaFLOPS (200億億次)的El Capitan超算將采用AMD MI300A，這將使得El Capitan成為世界上最快的超級(jí)計(jì)算機(jī)。

AI開(kāi)源軟件戰(zhàn)略持續(xù)強(qiáng)化

AMD 發(fā)布了最新的ROCm 6開(kāi)放軟件平臺(tái)，也是AMD對(duì)開(kāi)源社區(qū)貢獻(xiàn)最先進(jìn)的庫(kù)的承諾。Lisa Su表示，ROCm 6代表AMD軟件工具的重大飛躍，進(jìn)一步推進(jìn)了AMD開(kāi)源AI軟件開(kāi)發(fā)的愿景。該軟件平臺(tái)增強(qiáng)了AMD的AI加速性能，在 MI300 系列加速器上運(yùn)行Llama 2 文本生成時(shí)，與上一代硬件和軟件相比，性能提高約8倍。

針對(duì)生成式AI，ROCm 6增加了關(guān)鍵功能：包括 FlashAttention、HIPGraph 和 vLLM等。 AMD正在在與軟件伙伴推進(jìn)合作，例如PyTorch、TensorFlow、hugging face等，打造強(qiáng)大的AI生態(tài)系統(tǒng)，簡(jiǎn)化AMD AI 解決方案的部署。

此外，AMD 還通過(guò)收購(gòu)開(kāi)源軟件公司Nod.AI，進(jìn)一步增強(qiáng)為AI客戶提供開(kāi)放軟件的能力，使他們能夠輕松部署針對(duì)AMD硬件調(diào)整的高性能AI模型。并且通過(guò)與Mipsology的生態(tài)系統(tǒng)合作等，持續(xù)強(qiáng)化其開(kāi)源的AI軟件戰(zhàn)略。

AMD致力于建立一個(gè)開(kāi)放的軟件生態(tài)系統(tǒng)，利用廣泛的開(kāi)源社區(qū)基礎(chǔ)來(lái)加快創(chuàng)新步伐，同時(shí)為客戶提供更多的靈活性。不得不說(shuō)，對(duì)標(biāo)英偉達(dá)在AI領(lǐng)域強(qiáng)大的CUDA生態(tài)，此舉是AMD將其自身打造為有力的AI競(jìng)爭(zhēng)者的關(guān)鍵環(huán)節(jié)，也有助于AMD切入CUDA現(xiàn)有的市場(chǎng)。

三代產(chǎn)品演進(jìn)，Lisa首談三大AI戰(zhàn)略

前不久，AMD在公布2023年Q3財(cái)報(bào)時(shí)，預(yù)計(jì)到 2024 年數(shù)據(jù)中心 GPU 收入將超過(guò)20 億美元，實(shí)現(xiàn)大幅增長(zhǎng)。當(dāng)時(shí)，這種加速的收入預(yù)測(cè)主要取決于以AI為中心的解決方案，能夠滿足跨行業(yè)的各種AI工作負(fù)載的能力，這也是最新推出的MI300獲得業(yè)界高度關(guān)注的一個(gè)原因。

AMD的加速芯片之旅，始于第一代基于CDNA計(jì)算架構(gòu)的MI100，通過(guò)一些HPC的應(yīng)用和部署，為MI200取得更廣泛的商業(yè)成功鋪平了道路。MI200量產(chǎn)出貨已有幾年，在大型HPC和前沿AI部署應(yīng)用方面收獲頗豐，并且是超級(jí)計(jì)算機(jī)500強(qiáng)榜單的第一名。

也正是經(jīng)過(guò)這兩代產(chǎn)品的打磨，使AMD真正對(duì)AI工作負(fù)載、軟件需求等有了更深入的理解，為MI300打下了堅(jiān)實(shí)基礎(chǔ)。當(dāng)前，MI300A主要專注于HPC和AI應(yīng)用，是全球首個(gè)數(shù)據(jù)中心APU。MI300X則專為生成式AI而設(shè)計(jì)，通過(guò)硬件和軟件全面提升，使得該產(chǎn)品的應(yīng)用門(mén)檻進(jìn)一步降低。

Lisa Su在大會(huì)上首次談到了AMD的三大AI戰(zhàn)略：首先，AMD始終提供通用的、高性能的、節(jié)能的GPU、CPU和用于AI訓(xùn)練和推理的計(jì)算方案；其次，將繼續(xù)擴(kuò)展開(kāi)放、成熟和對(duì)開(kāi)發(fā)人員友好的軟件平臺(tái)，使得領(lǐng)先的AI框架、庫(kù)和模型都完全支持AMD硬件；第三，AMD將與合作伙伴擴(kuò)大聯(lián)合創(chuàng)新，包括云提供商、OEM、軟件開(kāi)發(fā)人員等等，實(shí)現(xiàn)更進(jìn)一步的AI加速創(chuàng)新。

寫(xiě)在最后

AMD此次推出MI300是其發(fā)展歷程中的一個(gè)重要里程碑。通過(guò)比英偉達(dá)H100更優(yōu)的一系列表現(xiàn)，AMD致力于成為生成式AI時(shí)代的有力競(jìng)爭(zhēng)者。

隨著重磅產(chǎn)品的問(wèn)世，大客戶合作是否會(huì)助力AMD加速追趕？AMD能否抓住AI時(shí)代機(jī)遇，復(fù)刻CPU成功之路？在高端GPU領(lǐng)域，英偉達(dá)已經(jīng)先發(fā)制人，AMD能否成為游戲規(guī)則改變者？

短期內(nèi)可以看到的是，隨著英偉達(dá)明年推出H200和B100兩款芯片，高端AI芯片的競(jìng)爭(zhēng)態(tài)勢(shì)繼續(xù)膠著，AI加速計(jì)算有望開(kāi)啟新一輪超級(jí)周期。

至于AMD是否有計(jì)劃開(kāi)發(fā)和銷售能夠符合美國(guó)對(duì)華芯片出口禁令的特定版本的MI 300？就在本文發(fā)稿前，AMD方面回應(yīng)：中國(guó)市場(chǎng)對(duì)AMD很重要，但今天沒(méi)有宣布專門(mén)針對(duì)中國(guó)市場(chǎng)的特別產(chǎn)品。

器件型號(hào)	數(shù)量	器件廠商	器件描述	ECAD模型	參考價(jià)格	更多信息
MK10DX256VLH7R	1	Freescale Semiconductor	Kinetis K 32-bit MCU, ARM Cortex-M4 core, 256KB Flash, 72MHz, QFP 64		$9.1	查看
ATXMEGA128A4U-AU	1	Microchip Technology Inc	IC MCU 8BIT 128KB FLASH 44TQFP	ECAD模型下載ECAD模型	$4.91	查看
DS3234SN#	1	Maxim Integrated Products	Real Time Clock, Non-Volatile, 1 Timer(s), CMOS, PDSO20, 0.300 INCH, ROHS COMPLIANT, SOP-20		$10.19	查看

器件型號(hào)

數(shù)量

器件廠商

器件描述

數(shù)據(jù)手冊(cè)

ECAD模型

風(fēng)險(xiǎn)等級(jí)

參考價(jià)格

更多信息

MK10DX256VLH7R

Freescale Semiconductor

Kinetis K 32-bit MCU, ARM Cortex-M4 core, 256KB Flash, 72MHz, QFP 64

$9.1

查看

ATXMEGA128A4U-AU

Microchip Technology Inc

IC MCU 8BIT 128KB FLASH 44TQFP

$4.91

查看

DS3234SN#

Maxim Integrated Products

Real Time Clock, Non-Volatile, 1 Timer(s), CMOS, PDSO20, 0.300 INCH, ROHS COMPLIANT, SOP-20

$10.19

查看

AMD年終大秀：MI300正面挑戰(zhàn)英偉達(dá)，Lisa Su首談AI三大戰(zhàn)略

MI300兩大系列：MI300X大型GPU、MI300A數(shù)據(jù)中心APU

生成式AI領(lǐng)域，MI300X正面挑戰(zhàn)英偉達(dá)

數(shù)據(jù)中心MI300A——E級(jí)APU成為現(xiàn)實(shí)

AI開(kāi)源軟件戰(zhàn)略持續(xù)強(qiáng)化

三代產(chǎn)品演進(jìn)，Lisa首談三大AI戰(zhàn)略

寫(xiě)在最后

推薦器件

相關(guān)推薦

電子產(chǎn)業(yè)圖譜

AMD年終大秀：MI300正面挑戰(zhàn)英偉達(dá)，Lisa Su首談AI三大戰(zhàn)略

MI300兩大系列：MI300X大型GPU、MI300A數(shù)據(jù)中心APU

生成式AI領(lǐng)域，MI300X正面挑戰(zhàn)英偉達(dá)

數(shù)據(jù)中心MI300A——E級(jí)APU成為現(xiàn)實(shí)

AI開(kāi)源軟件戰(zhàn)略持續(xù)強(qiáng)化

三代產(chǎn)品演進(jìn)，Lisa首談三大AI戰(zhàn)略

寫(xiě)在最后

推薦器件

相關(guān)推薦

電子產(chǎn)業(yè)圖譜

MI300兩大系列：MI300X大型GPU、MI300A數(shù)據(jù)中心APU

生成式AI領(lǐng)域，MI300X正面挑戰(zhàn)英偉達(dá)

三代產(chǎn)品演進(jìn)，Lisa首談三大AI戰(zhàn)略