自 2011 年以來,多家芯片開發(fā)商先后加入 Arm 服務(wù)器芯片的研發(fā)大營,但幾乎都是高起低落,不見蹤影者居多。Applied Micro 被 Macom 收購拆分;英偉達、三星、博通終止了相關(guān)業(yè)務(wù);高通因等多重壓力而被迫放棄服務(wù)器芯片研發(fā)。但是 Arm 陣營在服務(wù)器市場可謂屢戰(zhàn)屢敗,屢敗屢戰(zhàn)。
就在今年 3 月,Ampere 發(fā)布了“首款云原生處理器”Ampere Altra,擁有 80 個 64 位 Arm 處理器內(nèi)核,性能超越 AMD 和英特爾的同級別產(chǎn)品。不到三個月,Ampere 又快速進行了迭代,披露了 Ampere Altra Max 的信息,該產(chǎn)品將擁有 128 個內(nèi)核,能夠為客戶提供優(yōu)化的云計算處理器,實現(xiàn)單芯片整體性能以及機架內(nèi)核部署密度的最大化。
“一年前,Arm 架構(gòu)在服務(wù)器市場的技術(shù)、性能、軟件可能處于劣勢,但現(xiàn)在這些已經(jīng)不是主要問題,未來一兩年,基于 Arm 架構(gòu)的服務(wù)器芯片發(fā)展會非??臁!盇mpere 產(chǎn)品高級副總裁 Jeff Wittich 在接受與非網(wǎng)采訪時表示,“我們看到,亞馬遜也基于 Arm 架構(gòu)推出了相關(guān)產(chǎn)品,限制條件沒有了,未來一兩年會有很大的發(fā)展。”
Ampere 產(chǎn)品高級副總裁 Jeff Wittich
快速迭代升級,不僅高性能而且滿足安全、低功耗
面對未來云原生高性能、高擴展性、高能效的三大需求,Ampere Altra Max 處理器的性能進一步提升,內(nèi)核由 80 個提升到 128 個。Jeff 介紹,采用 Ampere Altra Max 的應(yīng)用將充分發(fā)揮橫向擴展和彈性云架構(gòu)優(yōu)勢。它兼容 Ampere 80 核的 Altra 處理器,并支持雙路服務(wù)器平臺。此外,它還將為行業(yè)帶來最高的插槽級性能和 I/O 可擴展性。插槽兼容支持 8 路 DDR4-3200 內(nèi)存通道,最多達到 128 條 PCIE Gen 4 通道。
在高端應(yīng)用中,隨著芯片核數(shù)的增加,功耗也會隨之提高,Ampere 也在想辦法平衡用戶對高性能、低功耗的需求。Jeff 解釋,“我們的策略是給客戶提供多種 SKU 產(chǎn)品,他們具有不同的優(yōu)勢,有的產(chǎn)品主頻更高,性能更好,有的產(chǎn)品功耗表現(xiàn)更好。在實際應(yīng)用中,有些應(yīng)用更看重低功耗的優(yōu)勢,我們有一款 32 核 CPU,主頻做到 1.7GHz,在不需要風(fēng)扇和冷卻的情況下,功耗最低 45 瓦,主要用于服務(wù)器的邊緣計算。
隨著全球的數(shù)字化轉(zhuǎn)型,云上業(yè)務(wù)的安全性也越來越受到關(guān)注,尤其是底層服務(wù)器芯片也容易受到攻擊。在安全方面,Jeff 強調(diào),“我們的產(chǎn)品符合所有 Arm 在安全方面的標(biāo)準(zhǔn),而且我們會做安全研發(fā)分析,確保服務(wù)器產(chǎn)品的安全。我們有專門的安全團隊來監(jiān)控產(chǎn)品面臨哪些威脅,并且與整個生態(tài)系統(tǒng)以及相關(guān)專家合作,確保我們開發(fā)的處理器避免出現(xiàn)安全漏洞?!?/p>
同樣采用64位內(nèi)核,如何讓性能超越“前賢”?
其實基于 Arm 做服務(wù)器芯片的公司不在少數(shù),國內(nèi)外不乏華為、飛騰、亞馬遜等一眾公司,但是能將性能超越英特爾的寥寥無幾。Ampere 的產(chǎn)品如何做到了性能的飛升?Jeff 解釋,“Arm 是最基礎(chǔ)的技術(shù),不同的 CPU 開發(fā)公司產(chǎn)品的靈活性非常大,不同公司在基于 Arm 開發(fā)產(chǎn)品,靈活性體現(xiàn)有所不同,著力點也不一樣。我們主要側(cè)重云端,增加內(nèi)核數(shù)量,提高效率,保證這些內(nèi)核在應(yīng)用時保持很高的一致性。”
一般,隨著內(nèi)核的增加,效率隨之提高,但是 AMD、英特爾的產(chǎn)品折損也在隨之增大,Ampere 產(chǎn)品的神奇之處在于,隨著內(nèi)核增多,效率提高,性能呈線性上升。Jeff 介紹,“第一,關(guān)于內(nèi)核技術(shù)包括其所占面積,我們研發(fā)了相關(guān)技術(shù),選擇合理的性能和合理的功能來保證在同樣預(yù)算條件下實現(xiàn)內(nèi)核和性能的線性增加。除了核數(shù)增加,性能提高之外,我們還做了很多其他關(guān)于帶寬、網(wǎng)格、延遲、IO 擴展、內(nèi)存的優(yōu)化,從而保證內(nèi)核能夠保持高性能運行。綜合這些因素,跟競品相比,我們的性能更卓越,可以更好地平衡功耗和性能的關(guān)系?!?/p>
前期“功課”準(zhǔn)備充分,從研發(fā)到應(yīng)用一路很“遛”
市場上的云供應(yīng)商眾多,尤其是在中國市場,廠商更多看重的是產(chǎn)品的性價比,Ampere 半年之內(nèi)推出兩款產(chǎn)品,也能說明產(chǎn)品受歡迎程度很高,Altra 處理器和 Altra Max 是否也是通過性價比來贏得用戶的青睞?在 Jeff 看來,客戶在選擇 CPU 時經(jīng)常參考三個標(biāo)準(zhǔn):性能、功耗、總體擁有成本。我們在這三個指標(biāo)上都非常領(lǐng)先,而且綜合考慮性能和功耗,我們的價格也非常優(yōu)惠。舉例來看,有一類 SKU 和 AMD 的同類產(chǎn)品相比,總體成本低 14%左右,比英特爾的優(yōu)勢就更明顯。Altra Max 處理器的內(nèi)核數(shù)量增加了 60%,而且功耗更低,綜合起來性價比更高。
關(guān)于中國的市場應(yīng)用以及遇到的問題,Jeff 也坦然介紹,“中國市場發(fā)展迅速,是 Ampere 的重要的市場,我們已經(jīng)和中國很多大型的云服務(wù)商有密切的合作。由于我們相關(guān)的軟件工作準(zhǔn)備充分,因此,產(chǎn)品研發(fā)和推廣都是按照計劃執(zhí)行,沒有遇到意想不到的問題。”
“當(dāng)然,由于肺炎疫情的問題,越來越多學(xué)在家學(xué)習(xí),很多公司要求員工在家辦公,這導(dǎo)致云提供商也在不斷增加其硬件配置,Ampere Altra 產(chǎn)品的需求隨之加大,新款 Ampere Altra Max 可以完美地滿足這些需求。”Jeff 補充。
順應(yīng)邊緣計算所需,開放心態(tài)關(guān)注RISC-V
隨著云端負(fù)載壓力過重,業(yè)界提出用邊緣計算分散云計算的壓力,因此數(shù)據(jù)中心的模式也在發(fā)生改變,從集中的大型數(shù)據(jù)中心向邊緣數(shù)據(jù)中心發(fā)展,這給服務(wù)器芯片供應(yīng)商也帶來新的發(fā)展機會。Jeff 認(rèn)為,邊緣數(shù)據(jù)中心與中央數(shù)據(jù)中心要求差不多,包括高性能、高核數(shù)、計算能力等。與中央數(shù)據(jù)中心的區(qū)別在于,邊緣數(shù)據(jù)中心也要實現(xiàn)中央數(shù)據(jù)中心同等的效果,但是還得面臨額外的挑戰(zhàn),比如占地面積、制冷、功耗,也就是要再更高效的平臺上實現(xiàn)同樣的計算能力。
關(guān)于邊緣數(shù)據(jù)中心為什么需要內(nèi)核性能越來越高?Jeff 解釋,因為它不僅是網(wǎng)絡(luò)處理簡單的工作,還需要完成 AI 這種低延遲計算,而且是要求較高的工作負(fù)載。Ampere 產(chǎn)品能夠在邊緣數(shù)據(jù)中心發(fā)揮重要作用,因為我們能夠部署更多的內(nèi)核,GPI 內(nèi)核更高,同時實現(xiàn)更高的性能,達到與中央數(shù)據(jù)中心差不多的計算性能和計算能力。
近幾年,RISC-V 架構(gòu)在國內(nèi)半導(dǎo)體市場受到了很高的關(guān)注,有些 IP 公司、芯片公司已經(jīng)開始基于 RISC-V 架構(gòu)開發(fā)產(chǎn)品,RISC-V 是否會對 Arm 架構(gòu)造成一定的市場壓力?面對這個問題,Jeff 表示,現(xiàn)在 RISC-V 架構(gòu)有很大的發(fā)展,我們對于所有相關(guān)的這些技術(shù)都持開放的態(tài)度。從服務(wù)器這個角度來說,RISC-V 在性能,包括軟件的相關(guān)生態(tài)系統(tǒng)方面還不具備可行性,但是我們會持續(xù)的關(guān)注 RISC-V 未來幾年的發(fā)展。