英特爾此次同時推出了全新服務(wù)器 GPU 和 oneAPI 軟件,意味著英特爾開始釋放 XPU 的強大實力。
?
雷鋒網(wǎng)消息,11 月 11 日,英特爾正式發(fā)布其全新服務(wù)器 GPU,即首款數(shù)據(jù)中心的獨顯產(chǎn)品,該服務(wù)器基于 Xe LP 微架構(gòu),專為高密度、低時延的安卓云游戲和流媒體服務(wù)而設(shè)計。同時,英特爾還宣布將于 12 月正式交付相應(yīng)的軟件堆棧 oneAPI Gold 工具。
英特爾此次同時推出了全新服務(wù)器 GPU 和 oneAPI 軟件,意味著英特爾開始釋放 XPU 的強大實力。
1、英特爾率先定義 XPU 時代
10 年前,美國數(shù)據(jù)科學(xué)家舍恩伯格在《大數(shù)據(jù)時代》一書中對“大數(shù)據(jù)時代”作出系統(tǒng)闡釋。
10 年后,互聯(lián)網(wǎng)、人工智能、云計算的發(fā)展正飛速推動全球數(shù)據(jù)量的增長。國際數(shù)據(jù)公司 IDC 統(tǒng)計顯示,預(yù)計到 2025 年,全球數(shù)據(jù)量將比 2016 年的 16.1 ZB(1 ZB=十萬億字節(jié))增加 10 倍,達到 163 ZB。
盡管越來越多的數(shù)據(jù)讓現(xiàn)代人置身于信隱私泄露的恐慌之中,但不可否認(rèn)的是,大數(shù)據(jù)正為硬件、軟件乃至服務(wù)等市場帶來前所未有的經(jīng)濟增長。
中國通信院發(fā)布的《大數(shù)據(jù)白皮書(2019)》顯示,預(yù)計到 2020 年,全球大數(shù)據(jù)硬件、軟件和服務(wù)的市場規(guī)模將分別達到 150 億美元、200 億美元和 210 億美元。這意味著基于大數(shù)據(jù),將產(chǎn)生一個全球范圍內(nèi)價值 560 億美元的市場。
但在這之前需要解決一個關(guān)鍵問題,在單一芯片算力受限的情況下,如何更好地發(fā)揮海量數(shù)據(jù)的真正價值?
對于這一問題,英特爾早已給出了答案。2015 年,英特爾就開始斥資 167 億美元收購當(dāng)時全球第二大 FPGA 廠商 Altera,此后,又接連收購主攻深度學(xué)習(xí)方向的 Nervana Systems、計算視覺公司 Movidius、自動駕駛視覺處理公司 Mobileye 和云端 AI 推理芯片已經(jīng)商用的 Habana Labs。
英特爾成為業(yè)界唯一一家擁有全類別 AI 芯片的公司之后,緊接著吸納業(yè)界頂尖的芯片人才,并于 2018 年架構(gòu)日提出制程、封裝、架構(gòu)、存儲、互聯(lián)、安全、軟件的六大技術(shù)戰(zhàn)略。
2018 年的架構(gòu)日在英特爾歷史上具有劃時代的意義,XPU 異構(gòu)愿景就誕生于此,即由標(biāo)量(Scalar)、矢量(Vector)、矩陣(Matrix)、空間(Spatial)組成的 SVMS 架構(gòu),分別對應(yīng) CPU、GPU、加速器和 FPGA,可以進行多種異構(gòu)組合。
這是英特爾首次、也是業(yè)界首次明確將單一架構(gòu)之后的發(fā)展方向定義為 XPU。
英特爾數(shù)據(jù)中心 XPU 產(chǎn)品和解決方案副總裁 Jeff McVeigh 表示:“XPU 戰(zhàn)略的提出,在于我們意識到需要不同類型的架構(gòu)來服務(wù)于各種不同的工作負(fù)載,其中一些工作負(fù)載在本質(zhì)上是標(biāo)量的,另一些是向量、矩陣、空間等等?!?/p>
2、從 Xe 架構(gòu)到獨立顯卡,實現(xiàn) XPU 愿景的重要一步
英特爾在 XPU 戰(zhàn)略上進展迅速,在其它芯片公司還處于大規(guī)模并購階段時,就已經(jīng)基于其豐富的技術(shù)經(jīng)驗推出了自有的首款面向數(shù)據(jù)中心的獨顯產(chǎn)品。
英特爾表示,這款 GPU 采用的是英特爾能效最高的圖形架構(gòu),英特爾 Xe LP 微架構(gòu),擁有低功耗、獨立片上系統(tǒng)(SoC)設(shè)計,并配備 128 比特管道和 8GB 專用板載低功耗 DDR4 顯存。
另外,如果將英特爾服務(wù)器 GPU 同英特爾至強可擴展處理器組合,服務(wù)提供商可以在不改變服務(wù)器數(shù)量的情況下,單獨擴展顯卡容量,得以在每個系統(tǒng)上支持更多流和訂閱用戶,并且同時實現(xiàn)較低的總體擁有成本(TCO)。
通過在新華三 3/4 長、全高的 x16 PCIe 3.0 擴展卡內(nèi)封裝四個英特爾服務(wù)器 GPU,即可在一個典型雙卡系統(tǒng)中支持超過 100 個安卓云游戲并發(fā)用戶。這一數(shù)量最高可擴展至 160 個并發(fā)用戶,實際數(shù)量取決于具體的游戲和服務(wù)器配。
之所以說英特爾 XPU 戰(zhàn)略進展迅速,是因為其從 2019 年底發(fā)布 Xe 架構(gòu)到推出基于 Xe 架構(gòu)的集成 GPU 和獨立 GPU 產(chǎn)品,以及用于數(shù)據(jù)中心獨顯產(chǎn)品,間隔時間不到一年,就兌現(xiàn)了產(chǎn)品交付計劃。
事實上,Xe 架構(gòu)作為一個基礎(chǔ) GPU 架構(gòu),屬性靈活且擴展性強,能夠衍生出多種針對不同領(lǐng)域和場景的 GPU 產(chǎn)品。
在英特爾 2020 年架構(gòu)日上,英特爾官方首次詳細(xì)介紹了可實現(xiàn)全擴展的 Xe 圖形架構(gòu)。按照不同的應(yīng)用場景分,可將 Xe 架構(gòu)分成四個系列:Xe LP、Xe HP、Xe HPC 和 Xe HPG。
Xe LP 屬于低功耗系列,是針對 PC 和移動計算平臺的最高效架構(gòu),最高配置 EU 單元多達 96 組,并具有新架構(gòu)設(shè)計,包括異步計算、視圖實例化 (view instancing)、采樣器反饋(sampler feedback)、帶有 AV1 的更新版媒體引擎以及更新版顯示引擎等。
TigerLake SoC 里集成的 GPU、英特爾銳炬 Xe MAX 獨立顯卡和此次發(fā)布的面向數(shù)據(jù)中心的獨顯產(chǎn)品均采用這一架構(gòu)。
作為首批使用英特爾首款數(shù)據(jù)中心獨顯產(chǎn)品的客戶之一,騰訊先游云游戲總經(jīng)理方亮認(rèn)為:“SG1 的編碼能力非常強,它能夠提供一個高密度、低延遲、靈活多樣的視頻編碼能力,另外在我們所測試的產(chǎn)品中,英特爾 SG1 的性價比高,英特爾技術(shù)團隊的支持也非常給力?!?/p>
Xe HP 屬于高性能系列,是業(yè)界首個多區(qū)塊(multi-tiled)、高度可擴展的高性能架構(gòu),可提供數(shù)據(jù)中心級、機架級媒體性能,GPU 可擴展性和 AI 優(yōu)化。目前處于同客戶共同測試的階段,Xe HP 產(chǎn)品將于明年推出。
Xe HPC 屬于高性能計算系列,可用于超級計算機。Xe HPG 是一種為游戲優(yōu)化的微架構(gòu),將具有加速的光線跟蹤支持,Xe HPG 產(chǎn)品預(yù)計將于 2021 年開始發(fā)貨。
3、天下大同 oneAPI,實現(xiàn) XPU 的“靈魂互通”
一般而言,基于底層硬件架構(gòu)的不同,完成同一項開發(fā)往往需要開發(fā)者使用不同的代碼重寫一次,需要付出極大的人力成本和財力成本。如果將硬件層面 XPU 的實現(xiàn)比喻成一個語言互不相通的團隊,那么要想更好地釋放團體的真正實力,還需要一臺能夠降低隊員們溝通成本,甚至能夠?qū)崿F(xiàn)“靈魂互通”的機器。
雖然從生物算法的角度,目前還沒有辦法實現(xiàn)意識和“靈魂”的交換和交流,計算機應(yīng)用程序的跨平臺優(yōu)化也一直是業(yè)界難點,但對于 XPU 而言,英特爾已經(jīng)開發(fā)出幫助 XPU 團隊釋放真正實力的工具,即英特爾軟件級 oneAPI 工具包。
英特爾官方表示,如果用上了 oneAPI 工具包,開發(fā)者就能夠訪問英特爾 XPU 的通用、開放且基于行業(yè)標(biāo)準(zhǔn)高的編程模型,釋放底層硬件性能的同時降低軟件開發(fā)和維護成本。
?
同時,Jeff 也告訴雷鋒網(wǎng):“oneAPI 能夠把人們熟悉的語言和庫上的代碼,比如所有目前已經(jīng)在至強處理器上運行的代碼,無縫地遷移到 GPU 和其他的架構(gòu)上。所以它確實有很多好處,比如代碼重用,能夠利用現(xiàn)有的庫等等。如果你已經(jīng)熟悉了一些庫,比如 TBB 和其他來自英特爾的庫,我們把它們進行了擴展以支持多種架構(gòu)。這樣已經(jīng)使用過這些庫的開發(fā)者可以繼續(xù)做開源,支持 GPU 和其他 XPU 架構(gòu)。”
“oneAPI 讓你不必有兩種不同的配置,兩種不同的構(gòu)建,但是能夠在設(shè)計點之間為完全相同的服務(wù)提供一些靈活性?!庇⑻貭枖?shù)據(jù)平臺事業(yè)部副總裁,視覺基礎(chǔ)架構(gòu)事業(yè)部和 NPG 戰(zhàn)略總經(jīng)理 LynnComp 補充道。
oneAPI 是英特爾在 SuperComputing2019 大會上首次提出且為實現(xiàn)統(tǒng)一、簡化的跨架構(gòu)編程模型的一個愿景,即不受限于單一廠商專用的代碼構(gòu)建,且能實現(xiàn)源有代碼的集成。借助 oneAPI,開發(fā)者可以針對他們要解決的特定問題選擇最佳的加速器架構(gòu),且無需為此一個架構(gòu)和平臺再重寫軟件。
英特爾初次提出這一愿景時,很多人認(rèn)為其實現(xiàn)難度大,能夠完成的可能性幾乎為零。但今天英特爾卻如期交付了 oneAPI 開發(fā)者工具包,足以證明其軟件實力。
英特爾宣布,英特爾 oneAPI 工具包將于 12 月在本地和英特爾 DevCould 上免費提供,同時還將提供包括英特爾技術(shù)咨詢工程師全球支持的商業(yè)版本。英特爾還會將英特爾 Parallel Studio XE 和英特爾 System Studio 工具套件遷移到 oneAPI 產(chǎn)品中。
?
值得一提的是,即便沒有使用英特爾的芯片,oneAPI 也能包容和支持,具有實現(xiàn)“天下大同”的能力,擁有廣泛的生態(tài)系統(tǒng),這也促使 oneAPI 得到更加廣泛的業(yè)界支持。近期,微軟 Azure 和谷歌的 TensorFlow 已經(jīng)宣布支持 oneAPI,眾多領(lǐng)先的研究機構(gòu)、公司和大學(xué)也支持 oneAPI。
4、雷鋒網(wǎng)小結(jié)
從收購 FPGA 公司到吸納圖形處理器頂尖人才,從發(fā)展單一架構(gòu)到定義 XPU 時代,從 Xe 架構(gòu)提出到如期交付產(chǎn)品,近些年英特爾一直在釋放大數(shù)據(jù)潛力的產(chǎn)業(yè)領(lǐng)域探索,如今成長為業(yè)界唯一一家能夠提供 XPU 芯片的全能性公司,且能為其應(yīng)將提供相適配的軟件、應(yīng)用程序和生態(tài),英特爾在數(shù)據(jù)在數(shù)據(jù)中心擁有獨一無二的實力。
未來的英特爾,又會在實現(xiàn) XPU 的路上取得什么樣的成績呢?