加入星計(jì)劃,您可以享受以下權(quán)益:

  • 創(chuàng)作內(nèi)容快速變現(xiàn)
  • 行業(yè)影響力擴(kuò)散
  • 作品版權(quán)保護(hù)
  • 300W+ 專業(yè)用戶
  • 1.5W+ 優(yōu)質(zhì)創(chuàng)作者
  • 5000+ 長(zhǎng)期合作伙伴
立即加入
  • 正文
    • 英偉達(dá)專注的 GPU 優(yōu)勢(shì)逐漸縮小
    • 利用 AI 計(jì)算打側(cè)面競(jìng)爭(zhēng)戰(zhàn)
    • 兩種芯片勢(shì)能英偉達(dá)與 Graphcore 的較量
    • AI 計(jì)算未來(lái)有三種計(jì)算平臺(tái)
    • 構(gòu)建生態(tài)鏈條 IPU 仍在路上
    • 結(jié)尾:
  • 相關(guān)推薦
  • 電子產(chǎn)業(yè)圖譜
申請(qǐng)入駐 產(chǎn)業(yè)圖譜

趨勢(shì)丨向AI求生的路上,GPU已上岸,IPU在崛起

2020/10/19
258
閱讀需 8 分鐘
加入交流群
掃碼加入
獲取工程師必備禮包
參與熱點(diǎn)資訊討論

AI 近些年的大火,直接促進(jìn)了 CPU 和 GPU 的發(fā)展,而英偉達(dá)的 GPU 真正借此迅速成為 AI 市場(chǎng)的主流產(chǎn)品之一,其勢(shì)頭甚至蓋過(guò)了 CPU。

而 AI 應(yīng)用需要專門的處理器,而 IPU 正是這樣的處理器。目前,AI 在各行各業(yè)均得到廣泛應(yīng)用,IPU 可以基于自身優(yōu)勢(shì)為世界的智能化進(jìn)程增添不竭動(dòng)力。

英偉達(dá)專注的 GPU 優(yōu)勢(shì)逐漸縮小

從專注圖像渲染崛起的英偉達(dá)的 GPU,走的也是相當(dāng)于 ASIC 的技術(shù)路線,但隨著游戲、視頻渲染以及 AI 加速需要的出現(xiàn),英偉達(dá)的 GPU 也在向著 GPGPU 的方向演進(jìn)。

當(dāng)硬件更多的需要與軟件生態(tài)掛鉤時(shí),市場(chǎng)大多數(shù)參與者便會(huì)倒下。在競(jìng)爭(zhēng)清理過(guò)后,GPU 形成了如今的雙寡頭市場(chǎng),并且步入相當(dāng)成熟的階段。

ASIC 本身的成本、靈活性缺失,以及應(yīng)用范圍很窄的特點(diǎn),都導(dǎo)致它無(wú)法采用最先進(jìn)制程:即便它們具備性能和能效優(yōu)勢(shì),一旦無(wú)法采用最先進(jìn)制程,則這一優(yōu)勢(shì)也將不再明顯。 

為保持其在 GPU 領(lǐng)域的寡頭地位,使得英偉達(dá)必須一直保持先進(jìn)的制程工藝,保持其通用性,但是要犧牲一定的效能優(yōu)勢(shì)。

相比于來(lái)自類 GPU 的競(jìng)爭(zhēng),英偉達(dá)不應(yīng)該忽視 Graphcore 的 IPU,特別是 Graphcore 一直都在強(qiáng)調(diào)其是為 AI 而生,面向的應(yīng)用也是 CPU、GPU 不那么擅長(zhǎng)的 AI 應(yīng)用。

利用 AI 計(jì)算打側(cè)面競(jìng)爭(zhēng)戰(zhàn)

不管 CPU 還是 GPU 都無(wú)法從根本上解決 AI 問(wèn)題,因?yàn)?AI 是一個(gè)面向計(jì)算圖的任務(wù)、與 CPU 的標(biāo)量計(jì)算和 GPU 的矢量計(jì)算區(qū)別很大。

而另一邊的 IPU,則為 AI 計(jì)算提供了全新的技術(shù)架構(gòu),同時(shí)將訓(xùn)練和推理合二為一,兼具處理二者工作的能力。

作為標(biāo)準(zhǔn)的神經(jīng)網(wǎng)絡(luò)處理芯片,IPU 可以支持多種神經(jīng)網(wǎng)絡(luò)模型,因其具備數(shù)以千計(jì)到數(shù)百萬(wàn)計(jì)的頂點(diǎn)數(shù)量,遠(yuǎn)遠(yuǎn)超過(guò) GPU 的頂點(diǎn)規(guī)模,可以進(jìn)行更高潛力的并行計(jì)算工作。

計(jì)算加上數(shù)據(jù)的突破可以讓 IPU 在原生稀疏計(jì)算中展現(xiàn)出領(lǐng)先 IPU 10-50 倍的性能優(yōu)勢(shì),到了數(shù)據(jù)稀疏以及動(dòng)態(tài)稀疏時(shí),IPU 就有了比 GPU 越來(lái)越顯著的優(yōu)勢(shì)。

此外,如果是在 IPU 更擅長(zhǎng)的分組卷積內(nèi)核中,組維度越少,IPU 的性能優(yōu)勢(shì)越明顯,總體而言,有 4-100 倍的吞吐量提升。

5G 網(wǎng)絡(luò)切片和資源管理中需要用到的強(qiáng)化學(xué)習(xí),用 IPU 訓(xùn)練吞吐量也能夠提升最多 13 倍。

兩種芯片勢(shì)能英偉達(dá)與 Graphcore 的較量

Graphcore 成立于 2016 年,是一家專注于機(jī)器智能、同時(shí)也代表著全新計(jì)算負(fù)載的芯片制造公司,其包括 IPU 在內(nèi)的產(chǎn)品研發(fā)擅長(zhǎng)大規(guī)模并行計(jì)算、稀疏的數(shù)據(jù)結(jié)構(gòu)、低精度計(jì)算、數(shù)據(jù)參數(shù)復(fù)用以及靜態(tài)圖結(jié)構(gòu)。

英偉達(dá)的潛在競(jìng)爭(zhēng)對(duì)手 Graphcore 的第二代 IPU 在多個(gè)主流模型上的表現(xiàn)優(yōu)于 A100 GPU,兩者將在超大規(guī)模數(shù)據(jù)中心正面競(jìng)爭(zhēng)。

未來(lái),IPU 可能在一些新興的 AI 應(yīng)用中展現(xiàn)出更大的優(yōu)勢(shì)。

?

第二代 IPU 相比第一代 IPU 有兩倍峰值算力的提升,在典型的 CV 還有 NLP 的模型中,第二代 IPU 相比第一代 IPU 則展現(xiàn)出了平均 8 倍的性能提升。

如果對(duì)比英偉達(dá)基于 8 個(gè)最新 A100 GPU 的 DGX-A100,Graphcore 8 個(gè) M2000 組成的系統(tǒng)的 FP32 算力是 DGX-A100 的 12 倍,AI 計(jì)算是 3 倍,AI 存儲(chǔ)是 10 倍。

AI 計(jì)算未來(lái)有三種計(jì)算平臺(tái)

第一種平臺(tái)是 CPU,它還會(huì)持續(xù)存在,因?yàn)橐恍I(yè)務(wù)在 CPU 上的表現(xiàn)依然不錯(cuò);

第二種平臺(tái)是 GPU,它還會(huì)持續(xù)發(fā)展,會(huì)有適合 GPU 的應(yīng)用場(chǎng)景。

第三種平臺(tái)是就是 Graphcore 的 IPU。

IPU 旨在幫助創(chuàng)新者在 AI 應(yīng)用上實(shí)現(xiàn)新的突破,幫助用戶應(yīng)對(duì)當(dāng)前在 CPU、GPU 上表現(xiàn)不太好的任務(wù)或者阻礙大家創(chuàng)新的場(chǎng)景。”盧濤副總指出。

目前 GPU 在全球已是大規(guī)模的商用部署,其次是 Google 的 TPU 通過(guò)內(nèi)部應(yīng)用及 TensorFlow 的生態(tài)占第二大規(guī)模,IPU 處于第三,是量產(chǎn)的、部署的平臺(tái)。

與此同時(shí),Graphcore 也在中國(guó)積極組建其創(chuàng)新社區(qū)。Graphcore 已在微信、知乎、微博和 GitHub 開通了官方頻道,旨在與開發(fā)者、創(chuàng)新者、研究者更好地交流和互動(dòng)。

關(guān)于未來(lái)的 AI 計(jì)算領(lǐng)域,未來(lái)會(huì)是 “CPU、GPU、IPU 并行” 的時(shí)代,GPU 或部分 CPU 專注于業(yè)務(wù)場(chǎng)景的實(shí)現(xiàn)和落地,而 IPU 專為 AI 創(chuàng)新者帶來(lái)更多突破。

?

構(gòu)建生態(tài)鏈條 IPU 仍在路上

IPU 想要在 AI 計(jì)算中擁有挑戰(zhàn) GPU 地位的資格,除了在性能和價(jià)格上面證明自己的優(yōu)勢(shì)之外,還需要在為機(jī)器學(xué)習(xí)框架提供的軟件棧上提供更多選擇,獲得主流 AI 算法廠商的支持。

在標(biāo)準(zhǔn)生態(tài)、操作系統(tǒng)上也需要有廣泛的支持,對(duì)于開發(fā)者有更方便的開發(fā)工具和社區(qū)內(nèi)容的支持,才能從實(shí)際應(yīng)用中壯大 IPU 的開發(fā)生態(tài)。

一個(gè) AI 芯片從產(chǎn)出到大規(guī)模應(yīng)用必須要經(jīng)過(guò)一系列的中間環(huán)節(jié),包括像上面提到的支持主流算法框架的軟件庫(kù)、工具鏈、用戶生態(tài)等等,打通這樣一條鏈條都會(huì)面臨一個(gè)巨大挑戰(zhàn)。

目前申請(qǐng)使用 Graphcore IPU 開發(fā)者云的主要是商業(yè)用戶和高校,個(gè)人研究者比較少。IPU 開發(fā)者云支持當(dāng)前一些最先進(jìn)和最復(fù)雜的 AI 算法模型的訓(xùn)練和推理。

?

和本世紀(jì)初的 GPU 市場(chǎng)一樣,在 AI 芯片市場(chǎng)步入弱編程階段,如今百家爭(zhēng)鳴的局面預(yù)計(jì)也將很快結(jié)束,市場(chǎng)在一輪廝殺后會(huì)剩下為數(shù)不多的參與者做最終對(duì)決。

現(xiàn)在要看的是在發(fā)展初期的逐一擊破階段,Graphcore 是否真有定義并主控第三類芯片的魄力了。

不過(guò)從創(chuàng)新的架構(gòu)到芯片再到成為革命性的產(chǎn)品,Graphcore 從芯片到落地之間的距離,需要易用的軟件和豐富的工具來(lái)支持,特別是對(duì)軟件生態(tài)依賴程度比較到的云端芯片市場(chǎng)。

結(jié)尾:

IPU 不是 GPU,這個(gè)可能是最大的一個(gè)挑戰(zhàn),但同時(shí)也是最大的一個(gè)機(jī)會(huì)。IPU 并不是 GPU 的替代品或者類似品,所以不能拿 GPU 的邏輯來(lái)套用 IPU 的邏輯。

近兩年,AI 芯片出現(xiàn)了各種品類的井噴,可以預(yù)計(jì)未來(lái) IPU 在各類 AI 應(yīng)用中將具有更大的優(yōu)勢(shì)。

相關(guān)推薦

電子產(chǎn)業(yè)圖譜

AI芯天下是智能芯片行業(yè)垂直自媒體。采用媒體+行業(yè)的模式,堅(jiān)持從芯出發(fā),用心服務(wù)的理念,致力于豐富的網(wǎng)絡(luò)基礎(chǔ)資源建設(shè)。官網(wǎng):http://www.world2078.com/ 公眾號(hào):World_2078

TA的熱門作品
產(chǎn)業(yè)丨玻璃基板越發(fā)強(qiáng)勢(shì),AI時(shí)代下或?qū)⒂兴鳛?>
				</a>
							</li>
						<li id= 深度丨谷歌發(fā)布自研量子芯片Willow,試圖解決量子計(jì)算的糾錯(cuò)問(wèn)題
  • 產(chǎn)業(yè)丨關(guān)注關(guān)鍵零部件核心競(jìng)爭(zhēng)力,日本正拆解國(guó)產(chǎn)新能源
  • 產(chǎn)業(yè)丨LiveBench榜單比拼,階躍星辰成為國(guó)內(nèi)大模型第一
  • 產(chǎn)業(yè)丨吉利6.88億入局UAM,低空賽道冰火兩重天
  • 查看更多