什么是GPGPU?
GPGPU似乎是最近幾年才流行起來(lái)的,外行人聽(tīng)著感覺(jué)是比GPU還要厲害的東西。事實(shí)上,GPGPU是英文General-Purpose computing on Graphics Processing Units的縮寫,中文譯為通用圖形處理器,可以理解為是GPU的一個(gè)分支。
從歷史的角度來(lái)看,GPU的產(chǎn)生是為了解決游戲中圖形渲染效率的問(wèn)題,但是隨著圖形芯片技術(shù)的不斷迭代,GPU的處理功能和計(jì)算能力不斷提升。2001年,得益于shader的出現(xiàn),GPU在圖形流水線中引入了可編程性,從此GPU能做的事情不再局限于圖形數(shù)據(jù)的處理,而將觸角延伸至其他計(jì)算密集的領(lǐng)域,開(kāi)啟了GPGPU時(shí)代。
跳過(guò)GPU,本土廠商為何選擇自研GPGPU?
有人說(shuō),沒(méi)了圖形渲染的GPGPU不過(guò)是一款專用的ASIC,真的是這樣嗎?在2021年中國(guó)集成電路設(shè)計(jì)創(chuàng)新大會(huì)上,筆者也對(duì)該問(wèn)題進(jìn)行了提問(wèn)。沐曦的CEO陳維良是這樣回復(fù)的,“ASIC的設(shè)計(jì)是偏離通用GPU架構(gòu)的,其軟件適配靈活性將面臨很大的挑戰(zhàn),產(chǎn)品的應(yīng)用生命周期也比GPGPU短。”這意味著GPGPU和ASIC從底層架構(gòu)上就能區(qū)別是兩種技術(shù),各自服務(wù)于相應(yīng)的應(yīng)用場(chǎng)景,并不能混為一談。
?
圖源:沐曦官網(wǎng)
至于“跳過(guò)GPU,直接選擇GPGPU新戰(zhàn)場(chǎng)”的原因,陳維良表示,“全球GPU市場(chǎng)已經(jīng)形成半壟斷局面,再加上圖形渲染是一個(gè)存量市場(chǎng),正面交鋒實(shí)屬不易,選擇增量市場(chǎng)的計(jì)算型GPU,也就是我們說(shuō)的GPGPU,也許是明智之舉?!?/p>
事實(shí)上,跳過(guò)GPU的說(shuō)法本身就不是很準(zhǔn)確。從GPU體系架構(gòu)的角度來(lái)看,我們可以把GPGPU分為三大家族。
第一個(gè)家族的長(zhǎng)輩是傳統(tǒng)GPU,主導(dǎo)者包括英偉達(dá)和AMD/ATI,這類架構(gòu)有一個(gè)顯著的特性,那就是包含大量結(jié)構(gòu)簡(jiǎn)單的處理核心構(gòu)成的陣列。它會(huì)以高度并行化的方式批量處理數(shù)據(jù),這些帶有向量特征的處理陣列是由傳統(tǒng)GPU中的多條并行的渲染管線發(fā)展而來(lái)。此外,這類GPGPU中仍或多或少地存在一些專用于圖像處理的部件,如紋理Cache、幀緩沖等。但是,隨著通用計(jì)算的需求日益顯著,GPGPU正越來(lái)越專注于通用計(jì)算能力,而漸漸弱化其作為顯卡的功能。
第二個(gè)家族的長(zhǎng)輩是傳統(tǒng)的多核CPU,典型代表是以CPU著稱的Intel,它的架構(gòu)理念是對(duì)傳統(tǒng)CPU核心進(jìn)行裁剪,從而得到相對(duì)輕量級(jí)的處理核心,構(gòu)成其計(jì)算部件。這樣做的優(yōu)點(diǎn)是可以兼容部分傳統(tǒng)CPU的指令集,它的缺點(diǎn)是相對(duì)于上述GPGPU中的細(xì)粒度處理單元,這類處理核心仍然比較復(fù)雜,因此核心的集成度遠(yuǎn)不及第一家族的GPGPU。
第三個(gè)家族是GPU和CPU的聯(lián)姻產(chǎn)物,融合了GPU和CPU的架構(gòu)特色,典型的代表是AMD的APU產(chǎn)品系列。這類架構(gòu)的做法是將GPGPU中的處理陣列直接作為CPU的加速部件集成到同一顆芯片內(nèi)。這樣做帶來(lái)了兩大好處,好處一:CPU核心的融入增強(qiáng)了GPGPU的標(biāo)量處理能力,更適合通用計(jì)算的要求;好處二:融合的結(jié)構(gòu)可緩解GPGPU和CPU之間的通信帶寬受限問(wèn)題。
此外,英偉達(dá)作為一家美籍華人創(chuàng)立的公司,其實(shí)并沒(méi)有把太多的研發(fā)工作投在中國(guó),所以從人才組成的角度,我國(guó)做GPGPU的創(chuàng)業(yè)者大部分來(lái)自AMD、Imagination和Intel,其中AMD占主導(dǎo)。事實(shí)上,這些本土公司在做GPGPU時(shí),他們的研發(fā)人員之前都經(jīng)歷過(guò)GPU相關(guān)技術(shù)的研發(fā),因此從技術(shù)的角度來(lái)說(shuō),并沒(méi)有跳過(guò)GPU,而站在市場(chǎng)的角度,面對(duì)數(shù)據(jù)爆發(fā)時(shí)代的到來(lái),自研GPGPU是順應(yīng)市場(chǎng)自然選擇的結(jié)果。
頭部站隊(duì)初步形成,國(guó)產(chǎn)GPGPU正醞釀一場(chǎng)“大落地”
根據(jù)不完全統(tǒng)計(jì),中國(guó)大陸大約有7家相對(duì)主流的GPGPU公司,它們分別是天數(shù)智芯、登臨科技、壁仞科技、摩爾線程、珠海芯動(dòng)力、沐曦和紅山微電子。
為什么說(shuō)頭部戰(zhàn)隊(duì)已經(jīng)基本形成呢?因?yàn)?strong>GPGPU的技術(shù)開(kāi)發(fā)難度是很高的。“通常業(yè)內(nèi)一款高端芯片的前端和后端設(shè)計(jì)要耗時(shí)1~3年,設(shè)計(jì)完成后的流片環(huán)節(jié),需要3~6個(gè)月,還會(huì)有流片失敗一切重來(lái)的風(fēng)險(xiǎn)。即使成功流片,仍然還需要經(jīng)過(guò)3~12個(gè)月的產(chǎn)品測(cè)試調(diào)優(yōu),才能最終開(kāi)啟量產(chǎn)?!?天數(shù)智芯董事長(zhǎng)兼CEO刁石京如是說(shuō)。
舉個(gè)例子,強(qiáng)如intel,從1997年開(kāi)始布局,通過(guò)收購(gòu)C&T,入股Real3D后,在1998年推出了第一款獨(dú)立GPU i740后就少有成果,直到2007年眼紅英偉達(dá)的GPGPU市場(chǎng),開(kāi)始重啟GPU計(jì)劃,推出產(chǎn)品Larrabee,可惜性能價(jià)格都沒(méi)有競(jìng)爭(zhēng)力,再到2020年又推出了全新的獨(dú)立GPU架構(gòu)Xe,可惜截至目前,Intel仍未推出自己消費(fèi)級(jí)的獨(dú)立GPU產(chǎn)品。
由此可知,GPGPU市場(chǎng)準(zhǔn)入門檻是很高的,而目前從大廠出來(lái)有這方面技術(shù)積累,又能拉到投資的人基本流動(dòng)得差不多了。此外,我們知道GPGPU的工藝要用上12nm、7nm甚至5nm技術(shù),除了高端技術(shù)人員的薪資支出以外,流片的成本也非常之高,高投入意味著必須要高產(chǎn)出才能盈利,因此產(chǎn)品落地量產(chǎn)勢(shì)在必行。而這些本土的GPGPU廠家大多面向數(shù)據(jù)中心和云端市場(chǎng),頭部可以配合“拉練”的客戶梯隊(duì)也都已經(jīng)形成,后面再擠入困難有些大。
?
圖 | 天垓100,圖源:天數(shù)智芯官網(wǎng)
結(jié)合上述論點(diǎn),我們來(lái)看一下本土GPGPU廠商的進(jìn)展情況。從產(chǎn)品落地的角度來(lái)看,目前只有天數(shù)智芯宣布其首款云端7nm GPGPU產(chǎn)品卡——“天垓100”已正式進(jìn)入量產(chǎn)環(huán)節(jié)(今年10月29日的消息),單芯算力每秒147T@FP16。緊隨其后的是登臨科技、珠海芯動(dòng)力和壁仞科技。登臨科技在2020年7月14日宣布其首款GPU+產(chǎn)品已成功回片通過(guò)測(cè)試,開(kāi)始客戶送樣,據(jù)悉今年11月已開(kāi)始啟動(dòng)量產(chǎn);珠海芯動(dòng)力的聯(lián)合創(chuàng)始人李原在今年7月份透露,其第一款應(yīng)用于邊緣服務(wù)器的芯片R8已經(jīng)流片,采用三星14nm工藝,算力達(dá)到32 TOPS,功耗小于14W;壁仞科技在今年的10月8日宣布其首款7nm GPGPU——BR100已正式交付臺(tái)積電流片,預(yù)計(jì)將于明年面向市場(chǎng)發(fā)布。接下來(lái)是摩爾線程,摩爾線程在11月25日的發(fā)布中只表明其首顆國(guó)產(chǎn)全功能GPU研制成功,換句話說(shuō)流片、測(cè)試、聯(lián)調(diào)等等都還是后頭的事兒。至于另外兩家,沐曦和紅山微電子,成立的日期相對(duì)較晚,目前應(yīng)該還在初代產(chǎn)品研發(fā)階段。值得一提的是,沐曦的研發(fā)隊(duì)伍還是很強(qiáng)大的,其創(chuàng)始人陳維良曾任AMD圖形研發(fā)高級(jí)總監(jiān),CTO楊建為前AMD Fellow,所以未來(lái)躋身前三的機(jī)會(huì)也很大。
當(dāng)然,前面只是根據(jù)各家企業(yè)產(chǎn)品落地的情況進(jìn)行了梳理,至于他們所用的產(chǎn)品架構(gòu)、工藝制程、算力、能效比、面向的細(xì)分市場(chǎng)以及公司戰(zhàn)略等都不在考慮的范圍內(nèi),要是都考慮進(jìn)來(lái),可能這個(gè)進(jìn)度又得推翻重來(lái)。不過(guò)從這些廠商的產(chǎn)品發(fā)布進(jìn)度來(lái)看,目前大家都想當(dāng)“第一”,可以說(shuō)是正在醞釀一場(chǎng)“趕集式”的大落地。
GPGPU的下游市場(chǎng)在哪里?
廠商的紛紛投入,離不開(kāi)投資界的推動(dòng),更離不開(kāi)下游市場(chǎng)的需求。
據(jù)公開(kāi)數(shù)據(jù)顯示,目前中國(guó)GPGPU 90%的市場(chǎng)都被以英偉達(dá)為代表的外企瓜分,僅2019年,英偉達(dá)和AMD兩大美企就在國(guó)內(nèi)GPGPU市場(chǎng)賺走了約80億元。半壟斷市場(chǎng)帶來(lái)的是高售價(jià),當(dāng)前一塊高端的GPGPU板卡,市場(chǎng)售價(jià)高達(dá)十幾萬(wàn)元,相當(dāng)于一輛普通小轎車的價(jià)格。與此同時(shí),有專家預(yù)測(cè),到2025年,我國(guó)GPGPU芯片板卡的市場(chǎng)規(guī)模將達(dá)458億元,年復(fù)合增長(zhǎng)率高達(dá)32%。由此可見(jiàn),GPGPU產(chǎn)品國(guó)產(chǎn)化勢(shì)在必行。
那么有人要問(wèn)了,國(guó)內(nèi)GPGPU的市場(chǎng)需求到底分布在哪些行業(yè)呢?根據(jù)業(yè)內(nèi)人士提供的中國(guó)GPGPU出貨量行業(yè)結(jié)構(gòu)信息顯示,2019年接近一半的GPGPU用于互聯(lián)網(wǎng)市場(chǎng),三分之一左右的GPGPU用于安防和政府市場(chǎng),十分之一左右的GPGPU用于其他行業(yè)的AI應(yīng)用,接近十分之一的GPGPU用于HPC市場(chǎng)。當(dāng)然這是2019年的數(shù)據(jù),現(xiàn)在的情況可能會(huì)有所調(diào)整,比如HPC的比重有所增加等等。
寫在最后
英偉達(dá)3000億美元市值、AMD1000億美元市值,中國(guó)的GPGPU市場(chǎng)規(guī)模和賽道都足夠大,也許三五年后,本土也能做出個(gè)“小英偉達(dá)”、“小AMD”來(lái)。所以說(shuō),國(guó)產(chǎn)GPGPU的下一步考驗(yàn)的是如何做大?而除了持續(xù)融資提供經(jīng)濟(jì)動(dòng)力外,這些公司所有的競(jìng)爭(zhēng)力都將聚焦于一點(diǎn),那就是產(chǎn)品高性能下的性價(jià)比,性價(jià)比決定出貨量,出貨量代表市場(chǎng)的認(rèn)可,市場(chǎng)帶來(lái)資金活水,從而形成良性循環(huán)。
?