作者?|??ZeR0,編輯?|??漠影
新規(guī)為中國(guó)的AI計(jì)算產(chǎn)業(yè)設(shè)置重重阻礙。
芯東西10月19日?qǐng)?bào)道,在美國(guó)商務(wù)部工業(yè)和安全局(BIS)周二公布了先進(jìn)計(jì)算芯片出口管制新規(guī)(美國(guó)升級(jí)AI芯片和半導(dǎo)體設(shè)備禁令,壁仞科技、摩爾線程被列入實(shí)體清單)后,英偉達(dá)RTX 4090顯卡禁運(yùn)風(fēng)波鬧得沸沸揚(yáng)揚(yáng)。
根據(jù)英偉達(dá)發(fā)布的最新公告,臨時(shí)最終規(guī)則對(duì)超過(guò)某些性能閾值的芯片出口到中國(guó)等地施加了額外的許可要求,包括但不限于A100、A800、H100、H800、L40、L40S、RTX 4090。英偉達(dá)DGX、HGX系統(tǒng)等任何包含一個(gè)或多個(gè)涵蓋上述芯片的系統(tǒng)也適用于新的許可要求。
此消息一出,游戲圈氣氛剎時(shí)變得緊張起來(lái)。因?yàn)檫@次不僅是用在數(shù)據(jù)中心的AI計(jì)算芯片,就連英偉達(dá)的消費(fèi)級(jí)旗艦顯卡GeForce RTX 4090也在被限制之列。而如果后續(xù)限制規(guī)則不變或進(jìn)一步升級(jí),影響范疇可能擴(kuò)大至更多英偉達(dá)下一代旗艦及高端消費(fèi)級(jí)顯卡。
不知是被搶購(gòu)一空還是囤貨炒價(jià),很快國(guó)內(nèi)主流電商平臺(tái)上的RTX 4090公版/非公版顯卡已經(jīng)奇貨可居,絕大部分顯示“缺貨”狀態(tài)。
不過(guò)關(guān)于RTX 4090的“禁運(yùn)”問(wèn)題,影響還未一錘定音,目前看主要影響的不是零售,而是國(guó)內(nèi)相關(guān)代工生產(chǎn)。根據(jù)出口新規(guī),美國(guó)商務(wù)部工業(yè)和安全局(BIS)引入了一項(xiàng)豁免,允許出口用于消費(fèi)應(yīng)用的芯片。新規(guī)也對(duì)少量高端游戲芯片制定了“通報(bào)要求”,以提高出貨量可見(jiàn)度。
另?yè)?jù)港媒HKEPC報(bào)道,美國(guó)商務(wù)部就出口管制文件作出澄清,關(guān)于RTX 4090禁令,出口消費(fèi)級(jí)應(yīng)用可申請(qǐng)作出豁免,因此RTX 4090可以在中國(guó)零售市場(chǎng)售賣,只是不能用作商用及生產(chǎn),中國(guó)代工廠不能生產(chǎn)RTX 4090。但由于該消息并未標(biāo)注明確來(lái)源,真實(shí)性尚待考證。
01.更改受限芯片性能紅線,影響英偉達(dá)/英特爾/AMD多款芯片出口
為什么RTX 4090會(huì)受影響?這與先進(jìn)計(jì)算芯片出口管制新規(guī)的調(diào)整有關(guān)。
去年10月7日實(shí)施的出口管制版本,主要是限制“處理性能”和“互連帶寬”,處理性能限制閾值是所有處理器單元的“位寬x算力(bits x TOPS)”總和≥4800,互連帶寬的限制閾值是總雙向傳輸速率達(dá)到或可編程到≥600Gb/s。
為了合規(guī),英偉達(dá)、英特爾都采取了向中國(guó)市場(chǎng)推出“降速版”AI芯片的措施:英偉達(dá)將對(duì)華銷售的H800/A800互連帶寬速度從H100/A100的600Gb/s降到400Gb/s,英特爾將對(duì)華銷售的AI訓(xùn)練芯片Gaudi2集成以太網(wǎng)端口數(shù)量從國(guó)際版的24個(gè)降至21個(gè)。
此次新規(guī)進(jìn)一步收緊,不限制“互連帶寬”了,改為限制“性能密度”,并用“總處理性能(TPP)”來(lái)取代之前的“位寬x算力”。根據(jù)ECCN 3A090修正,滿足以下任一條件,就會(huì)受出口限制:
1、3A090a:針對(duì)最高性能芯片
(1)TPP≥4800。(2)TPP≥1600,且性能密度≥5.92。
受限于這一區(qū)間的芯片預(yù)估包括:英偉達(dá)的H100、H800、A100、A800,英特爾的Max?1100、Max 1550、Gaudi2、Gaudi3,AMD的MI250、MI250X、MI300、MI300X、MI388等。
2、3A090b:針對(duì)次高性能芯片
(1)2400≤TPP<4800,且1.6≤性能密度<5.92。(2)TPP≥1600,且3.2≤性能密度<5.92。
受限于這一區(qū)間的芯片預(yù)估包括:英偉達(dá)的L40、L40S、A30、RTX 4090,英特爾的Flex Series 170,AMD的MI210、MI220等。
此外,一些性能略低于上述限制閾值的芯片出口,屬于“灰色地帶”,也要向美國(guó)政府通報(bào),由美國(guó)政府決定本次出口是否需要申請(qǐng)?jiān)S可證。
任何包含≥500億個(gè)晶體管并采用高帶寬內(nèi)存(HBM)的芯片或計(jì)算機(jī),都需要先獲得許可證,才能向中國(guó)等地出口。
02.TPP、性能密度怎么算?
根據(jù)注釋,3A090規(guī)定的芯片類型包括圖形處理器(GPU)、張量處理器(TPU)、神經(jīng)處理器、存內(nèi)處理器、視覺(jué)處理器、文本處理器、協(xié)處理器、自適應(yīng)處理器、現(xiàn)場(chǎng)可編程邏輯器件(FPLD)、專用集成電路(ASIC)。
具體計(jì)算方法為,“總處理性能(TPP)”是2 דMacTOPS”ד操作位長(zhǎng)度”,在集成電路上的所有處理單元上相加。對(duì)于3A090規(guī)定的同時(shí)提供稀疏矩陣和密集矩陣處理的芯片,“TPP”值是處理密集矩陣(如無(wú)稀疏性)的值。
“性能密度”即TPP除以“適用die面積”?!斑m用die面積”以mm2為單位測(cè)量,包括使用非平面晶體管架構(gòu)的工藝節(jié)點(diǎn)制造的邏輯die的所有die面積。
“MacTOPS”是用于乘法累加計(jì)算(D=AxB+C)的每秒Tera(10^12)操作的理論峰值數(shù)。“TPP”公式中的2基于將一次乘法累加計(jì)算(D=AxB+C)作為2次操作的行業(yè)慣例。
因此,2 × MacTOPS可能對(duì)應(yīng)于數(shù)據(jù)表上報(bào)告的TOPS或FLOPS。乘法累加計(jì)算的“操作位長(zhǎng)度”是乘法操作輸入的最大位長(zhǎng)度。“MacTOPS”的比率應(yīng)按理論上可能的最大值計(jì)算,被假定是制造商在年度或集成電路宣傳冊(cè)中宣稱的最高值。例如,“TPP”閾值4800可通過(guò)8位600tera整數(shù)運(yùn)算(或2×300MacTOPS)或16位300teraFLOPS(或2×150MacTOPS)來(lái)實(shí)現(xiàn)。如果芯片設(shè)計(jì)用于MAC計(jì)算,具有實(shí)現(xiàn)不同“TPP”值的多個(gè)位長(zhǎng)度,則應(yīng)根據(jù)3A090中的參數(shù)評(píng)估最高的“TPP”值。
出口管制新規(guī)還為具有AI功能的消費(fèi)級(jí)芯片增加了經(jīng)通報(bào)的先進(jìn)計(jì)算許可例外(NAC)。此許可例外適用于3A090.b和3A090.a規(guī)則下的芯片,即在收到向中國(guó)等地出口、再出口及轉(zhuǎn)運(yùn)的通報(bào)后,美國(guó)政府將決定是否可以適用該許可例外或需要許可證。
03.結(jié)語(yǔ):新規(guī)直沖AI大模型訓(xùn)練,短期內(nèi)不會(huì)對(duì)芯片巨頭業(yè)績(jī)?cè)斐蓻_擊
《先進(jìn)計(jì)算芯片規(guī)則(AC/S IFR)》將在1個(gè)月內(nèi)的11月16日生效,公眾評(píng)論的截止日期為規(guī)則公開(kāi)展示之日起60天。而英偉達(dá)2024財(cái)年第三季度截至2023年10月29日。也就是說(shuō)新規(guī)實(shí)施不會(huì)對(duì)英偉達(dá)最新第三季度的財(cái)務(wù)業(yè)績(jī)產(chǎn)生影響。不排除英偉達(dá)重施故技,再度為中國(guó)市場(chǎng)設(shè)計(jì)“閹割版”芯片的可能性。
新規(guī)進(jìn)一步擴(kuò)大對(duì)先進(jìn)計(jì)算芯片出口管制范圍的深度和廣度,表面上說(shuō)是為了“國(guó)家安全”,實(shí)際上是對(duì)中國(guó)的AI和高性能計(jì)算產(chǎn)業(yè)圍追堵截、設(shè)置重重阻礙。新規(guī)還尋求涉及基于硬件的技術(shù)解決方案的額外豁免建議,以限制具有受關(guān)注能力的大型兩用AI基礎(chǔ)模型的訓(xùn)練。