英語中有個(gè)詞叫做keep someone at arm's length(保持一臂之距,意為“敬而遠(yuǎn)之”),形容英特爾和AMD多年以來的關(guān)系最確切不過。不過,正如大家所看到的,這兩家芯片巨頭近期正在縮短彼此間的距離,促成此的正是——Arm的力量。
10月15日,在于美國西雅圖舉行的聯(lián)想創(chuàng)新科技大會上, 英特爾CEO 帕特·基辛格宣布,與AMD成立x86生態(tài)系統(tǒng)顧問小組。這也是長期互為競爭對手的兩家公司的罕見合作。不顧一臂之距彼此“抱團(tuán)”的背后,是x86對Arm一再提升的生態(tài)影響力的反擊。
Arm做了什么?
以芯片架構(gòu)IP授權(quán)為主營業(yè)務(wù)的Arm,生態(tài)組建幾乎是其生命線和盈利來源之所在。Arm的盈利來源,一方面是向芯片設(shè)計(jì)企業(yè)授權(quán)其架構(gòu)IP,采用其芯片內(nèi)核架構(gòu)的企業(yè),可以選擇付單次流片費(fèi)用,可以買三年內(nèi)無限次流片,還可以永久買斷;另一方面來自于收取芯片設(shè)計(jì)企業(yè)的版稅,即其客戶芯片量產(chǎn)后,Arm會根據(jù)產(chǎn)量按百分比收取版稅。
在這樣的商業(yè)模式下,Arm建立自身競爭力的途徑有兩條。一是發(fā)展更多的客戶,二是為客戶打通上下游。二者相輔相成,為Arm建造起規(guī)模相當(dāng)龐大的“朋友圈”。
在拓展芯片設(shè)計(jì)客戶這條路上,Arm走得很成功。憑借在低功耗方面的獨(dú)特優(yōu)勢,在消費(fèi)電子和AIoT應(yīng)用場景中,Arm幾乎成為芯片架構(gòu)IP授權(quán)“斷層領(lǐng)先”的存在。近幾年增長勢頭很猛的RISC-V生態(tài)中,基本上每一款新產(chǎn)品的推出都以Arm某系列產(chǎn)品為標(biāo)的。
在手機(jī)芯片市場,Arm斬獲了一眾頭部企業(yè)客戶:高通、蘋果、三星、聯(lián)發(fā)科……ARM架構(gòu)成為上述客戶每年更新的旗艦芯片的首選架構(gòu)。
為了增強(qiáng)客戶粘性、提升客戶體驗(yàn),Arm花了大量的工作“為客戶掃清障礙”。在軟件生態(tài)層面,擔(dān)心軟件在客戶的芯片上跑得不夠順暢,事先與軟件企業(yè)乃至APP開發(fā)者建立聯(lián)系,以保證架構(gòu)設(shè)計(jì)與軟件應(yīng)用的適配度。在硬件生態(tài)層面,擔(dān)心客戶芯片設(shè)計(jì)完成后在后期流片過程與代工廠交涉不順利,事先與臺積電等代工企業(yè)跑通路徑,降低客戶流片難度。
在產(chǎn)品交付方面,Arm提供的服務(wù)也越來越“保姆級”。為了方便此前選擇多款I(lǐng)P組合成“多核芯片”的客戶,Arm開始提供“打包”服務(wù)——事先對內(nèi)核進(jìn)行排列組合,形成一套“開機(jī)即用”的解決方案,客戶可以根據(jù)性能表現(xiàn)、功耗表現(xiàn)等選擇不同類型的組合方案,也就能在芯片內(nèi)核選用與組合過程中節(jié)省一部分時(shí)間。今年5月,Arm的“保姆式”服務(wù)再升級,甚至連IP在EDA工具中的工具流都能打包交付。
原本ARM和x86可以各自在移動(dòng)端和PC與數(shù)據(jù)中心端分庭而治。但近幾年,Arm在PC端乃至數(shù)據(jù)中心的動(dòng)作越來越多。在PC方面, 2023年10月驍龍峰會期間,高通推出面向PC打造的基于Arm架構(gòu)的驍龍X
Elite 芯片;今年5月,高通與微軟公司宣布合作,推出面向Windows的驍龍開發(fā)套件,微軟宣布其首批推出的Copilot+PC將搭載基于Arm架構(gòu)的高通驍龍X Elite處理器, “Windows on Arm”更進(jìn)一步。
自2019年開始,亞馬遜、Ampere等企業(yè)紛紛開始嘗試采用ARM架構(gòu)設(shè)計(jì)服務(wù)器CPU,并相較于英特爾、AMD的拳頭產(chǎn)品實(shí)現(xiàn)了能耗、成本雙降低。尤其是英偉達(dá)推出的144核超級CPU采用ARM架構(gòu),更是幫Arm擴(kuò)大了在高性能數(shù)據(jù)中心場景中的影響力。在PC和數(shù)據(jù)中心生態(tài)大力拓展的Arm,徹底觸碰了x86廠商的“蛋糕”。
x86的反擊
面對Arm咄咄逼人的生態(tài)攻勢,以英特爾、AMD等為核心的x86陣營坐不住了。盡管英特爾、AMD在長達(dá)幾十年的時(shí)間里互為競爭對手,明里暗里爭斗不斷。但在對抗共同的競爭對手Arm的事情上,二者還是站到了一起。
當(dāng)?shù)貢r(shí)間2024年10月15日,在聯(lián)想科技創(chuàng)新大會上宣布與AMD共同成立x86咨詢小組之后,英特爾首席執(zhí)行官帕特·基辛格在社交軟件X發(fā)表了與AMD董事長兼首席執(zhí)行官蘇姿豐的合影
過去幾十年,英特爾和AMD在指令集架構(gòu)設(shè)計(jì)上走的是獨(dú)立的設(shè)計(jì)路線。生態(tài)伙伴選擇英特爾或者AMD,都需要將技術(shù)路線重新驗(yàn)證一遍。
“不同x86供應(yīng)商之間的接口不一致,會導(dǎo)致重復(fù)的軟件開發(fā)、測試、部署、維護(hù)等問題。這會降低我們生態(tài)系統(tǒng)的價(jià)值?!?br /> 英特爾數(shù)據(jù)中心與AI執(zhí)行副總裁Justin Hotard說。
當(dāng)前,摩爾定律正面臨失效可能,芯片設(shè)計(jì)周期大大縮短,迭代速度大大加快。從芯片設(shè)計(jì)企業(yè)的旗艦芯片發(fā)布會從一年一發(fā)漸漸轉(zhuǎn)變?yōu)橐荒甓喟l(fā)就可見端倪。尤其是在“卷王”Arm,不斷強(qiáng)調(diào)幫助客戶縮短設(shè)計(jì)周期的能力,不斷降低芯片設(shè)計(jì)企業(yè)自研高性能芯片門檻的情況下,如果不能幫助客戶降低應(yīng)用難度,將會有更多客戶“跑單”。
由此,在10月15日于美國西雅圖舉行的聯(lián)想創(chuàng)新科技大會上,英特爾CEO 帕特·基辛格宣布,與AMD成立x86生態(tài)系統(tǒng)顧問小組。
10月16日,在美國舉行的2024開放計(jì)算項(xiàng)目全球峰會(2024 OCP Global Summit,以下簡稱“2024 OCP”)上,Justin Hotard再次強(qiáng)調(diào)這一舉措的目標(biāo):“我們希望讓AI時(shí)代的整個(gè)生態(tài)系統(tǒng)更容易和更簡單地繼續(xù)使用x86并從中受益?!?/p>
在2024 OCP活動(dòng)上,AMD數(shù)據(jù)中心解決方案執(zhí)行副總裁Forrest Norrod也強(qiáng)調(diào)了合作的重要性:有的公司會說,要由一家公司來完成設(shè)計(jì)、硬件和軟件的基本架構(gòu),這是計(jì)算機(jī)行業(yè)早期的處事方式。“在AMD,我們堅(jiān)信,真正的開放才是正確的前進(jìn)方式。為了在開放的水平上共同優(yōu)化和協(xié)作共同設(shè)計(jì),必須將所有生態(tài)系統(tǒng)整合在一起。”Forrest Norrod說。
在10月16日,2024OCP活動(dòng)上,AMD數(shù)據(jù)中心解決方案執(zhí)行副總裁Forrest Norrod和英特爾數(shù)據(jù)中心與AI執(zhí)行副總裁Justin Hotard介紹x86生態(tài)顧問小組未來前景
x86生態(tài)顧問小組有三大預(yù)期目標(biāo):為客戶在硬件和軟件方面提供更多選擇和更強(qiáng)的兼容性,使其更快地受益于全新的尖端功能;簡化架構(gòu)指南,以提升英特爾和AMD的x86產(chǎn)品系列在軟件一致性和接口方面的表現(xiàn);使新功能更廣泛、更高效地集成到操作系統(tǒng)、框架和應(yīng)用程序中將簡化生態(tài)系統(tǒng)軟件開發(fā)和維護(hù),為開發(fā)人員減少摩擦,以最大限度地提升效率并加速創(chuàng)新。
x86生態(tài)系統(tǒng)顧問小組以云計(jì)算場景為核心,創(chuàng)始成員業(yè)務(wù)涵蓋云計(jì)算、云原生應(yīng)用開發(fā)、服務(wù)器等環(huán)節(jié),這也顯示出x86“抱團(tuán)”的決心。
爭奪AI制高點(diǎn)
在數(shù)據(jù)中心場景中,誰能把AI帶來的高能耗打下來,成為生態(tài)爭奪的關(guān)鍵。
訓(xùn)練大模型所需的功耗正在增加。在滿足訓(xùn)練大模型過程中,芯片性能的提升也伴隨著驚人的功耗。AI服務(wù)器每個(gè)機(jī)架的功率提高了20倍。研究表明,數(shù)據(jù)中心能耗至少在未來四年內(nèi)將翻一番。
10月15日,Meta宣布將發(fā)布專為AI工作負(fù)載設(shè)計(jì)的高性能機(jī)架Catalina,基于NVIDIA Blackwell設(shè)計(jì),旨在支持NVIDIA GB200 Grace Blakwell超級芯片,其功率高達(dá)140kW。
近日,AMD展示了一組數(shù)據(jù),由于不斷增加的計(jì)算需求,在數(shù)據(jù)中心場景,從芯片到服務(wù)器、機(jī)架、數(shù)據(jù)中心的鏈條上,每個(gè)環(huán)節(jié)的能耗密度都在增加。
“一個(gè)小芯片內(nèi)部署了數(shù)千萬平方毫米的硅,過去500W左右的功耗,現(xiàn)在提高到千瓦以上,而在非常近的未來,這一數(shù)字將提高到2kW以上?!盕orrest Norrod說。當(dāng)前,單機(jī)架功耗已經(jīng)提高到250kW,一個(gè)大規(guī)模計(jì)算集群的計(jì)算節(jié)點(diǎn)已經(jīng)達(dá)到10萬個(gè)。
高功耗帶來的是不可持續(xù)。
Arm 基礎(chǔ)設(shè)施市場推廣副總裁Eddie Ramirez近日公開表示:“一個(gè)250kW的機(jī)架所需的電量大致相當(dāng)于一個(gè)社區(qū)。而當(dāng)前世界上沒有多少地方能夠應(yīng)對這種巨量的耗電需求。雖然當(dāng)前的技術(shù)可以實(shí)現(xiàn)對設(shè)備進(jìn)行冷卻,但難以支持大規(guī)模部署?!?/p>
為此,芯片供應(yīng)商正越來越重視功耗指標(biāo)。
Justin Hotard介紹了英特爾在幫助客戶降低大規(guī)模計(jì)算能耗的最新成效。NAVER Cloud是一家專注于提供超大規(guī)模AI云平臺的韓國企業(yè),該企業(yè)使用英特爾最新一代計(jì)算平臺Gaudi 2進(jìn)行優(yōu)化后,功耗效率已經(jīng)和英偉達(dá)H100的推理平臺不相上下。
Arm公司首席執(zhí)行官Rene Haas表示,與大型語言模型中的H100 GPU相比,Arm架構(gòu)實(shí)現(xiàn)的系統(tǒng)級設(shè)計(jì)優(yōu)化將把功耗降低至1/25,并將每個(gè)GPU的性能提高30倍。
當(dāng)前,芯片巨頭競爭的關(guān)鍵,正在逐漸從性能焦點(diǎn)擴(kuò)散開,單芯片性能、與系統(tǒng)的適配性、功耗,成為下游客戶衡量產(chǎn)品優(yōu)劣的新標(biāo)準(zhǔn)。尤其是在數(shù)據(jù)中心場景,能耗表現(xiàn)成為大客戶考察的重點(diǎn)。而系統(tǒng)能耗表現(xiàn),除了要求單芯片低功耗之外,更要求整體架構(gòu)設(shè)計(jì)的高效。
這也解釋了像聯(lián)想這樣的服務(wù)器供應(yīng)商,越來越強(qiáng)調(diào)液冷技術(shù)等“降耗神器”重要性的原因——如果不能提供能耗更低的數(shù)據(jù)中心解決方案,再高性能的單芯片計(jì)算方案在大規(guī)模集群面前也不具備性價(jià)比。
作者丨姬曉婷編輯丨諸玲珍美編丨馬利亞監(jiān)制丨連曉東