目前,高端智能手機(jī) CPU 都有一個(gè)叫做“神經(jīng)處理單元”的處理架構(gòu),但這真的會(huì)影響你嗎?
科技巨頭們已經(jīng)完全接受了人工智能革命。蘋果(Apple)、高通(Qualcomm)和華為(Huawei)生產(chǎn)的移動(dòng)芯片,旨在更好地解決機(jī)器學(xué)習(xí)任務(wù),每種芯片都采用了略有不同的方法。華為今年在 IFA 上推出了麒麟 970,其被稱為第一個(gè)有專門的神經(jīng)處理單元(NPU)的芯片。接著,蘋果推出了 A11 仿生芯片,iPhone 8、8 Plus 和 X 搭載的都是這款芯片。A11 仿生特性就是蘋果所說的“專為機(jī)器學(xué)習(xí)而設(shè)計(jì)”的神經(jīng)引擎。
上周,高通宣布推出 Snapdragon 845,它將 AI 任務(wù)發(fā)送到最合適的內(nèi)核。這三家公司的做法并沒有太大的差別,最終歸結(jié)為每個(gè)公司向開發(fā)者提供的接入水平,以及每個(gè)設(shè)備的耗電量。
在討論之前,讓我們來看看 AI 芯片是否與現(xiàn)有的 CPU 完全不同。最近,在行業(yè)中,經(jīng)常可以聽到的關(guān)于人工智能的術(shù)語(yǔ)是“異構(gòu)計(jì)算”。它指的是使用多種類型的處理器的系統(tǒng),每個(gè)處理器都有專門的功能,以獲得高性能或降低功耗。這個(gè)想法并不新穎,現(xiàn)在許多芯片組都使用異構(gòu)計(jì)算,蘋果、高通、華為這三家新推出的芯片只是在不同程度上使用了這個(gè)概念。
過去三年,智能手機(jī) CPU 一般都采用了 Arm 的 big.LITTLE 架構(gòu),該架構(gòu)將速度相對(duì)較慢、節(jié)能的核心與更快、耗電更快的內(nèi)核進(jìn)行配對(duì)。主要的目標(biāo)是盡可能少的使用電源,以獲得更好的電池壽命。第一批使用這種架構(gòu)的手機(jī)包括擁有自主研發(fā)手機(jī)處理器 Exynos5 芯片的三星 Galaxy S4,以及華為的 Mate8 和 Honor6。
今年的“人工智能芯片”將這一概念向前推進(jìn)了一步:要么增加了一個(gè)專門的組件來執(zhí)行機(jī)器學(xué)習(xí)任務(wù);要么,在 Snapdragon 845 的情況下,使用其他低功耗內(nèi)核來執(zhí)行。例如,Snaplong 845 可以利用它的數(shù)字信號(hào)處理器(DSP)來處理需要大量重復(fù)計(jì)算的長(zhǎng)時(shí)間運(yùn)行的任務(wù),比如偵聽熱詞。高通公司產(chǎn)品管理總監(jiān) Gary Brotman 表示,像圖像識(shí)別這樣的活動(dòng),是由 GPU 更好的管理的。Brotman 負(fù)責(zé) Snapdragon 平臺(tái)的 AI 和機(jī)器學(xué)習(xí)。
與此同時(shí),蘋果的 A11 仿生應(yīng)用在其 GPU 中使用了一個(gè)神經(jīng)引擎,以加快人臉識(shí)別,Animoji 和一些第三方應(yīng)用的速度。這意味著,當(dāng)啟動(dòng) iPhone X 上這些過程時(shí),A11 就會(huì)打開神經(jīng)引擎,進(jìn)行必要的計(jì)算,要么驗(yàn)證你是誰,要么把你的面部表情映射到對(duì)話框。
在麒麟 970 上,NPU 接管了一些任務(wù),比如掃描和翻譯用微軟翻譯器拍攝的圖片中的單詞。微軟翻譯器是目前為止唯一針對(duì)該芯片組進(jìn)行了優(yōu)化的第三方應(yīng)用程序。華為表示,“HiAI”異構(gòu)計(jì)算結(jié)構(gòu)最大限度地提高了其芯片組中大多數(shù)組件的性能,因此,它可能會(huì)將人工智能任務(wù)不僅僅分配給 NPU。
A11 仿生的兩個(gè)“性能”核心和四個(gè)“效率”核心
除了差異之外,這個(gè)新的架構(gòu)意味著,以前在云端處理的機(jī)器學(xué)習(xí),現(xiàn)在可以在設(shè)備上更高效地執(zhí)行了。通過使用 CPU 以外的部分來運(yùn)行 AI 任務(wù),手機(jī)可以同時(shí)做更多的事情,因此在等待翻譯或找到要找的圖片時(shí),不太可能會(huì)遇到延遲。
另外,在手機(jī)上運(yùn)行這些過程,而不是把它們發(fā)送到云端,對(duì)保護(hù)用戶隱私也有好處,因?yàn)檫@減少了黑客獲取用戶數(shù)據(jù)的潛在機(jī)會(huì)。
這些 AI 芯片的另一大優(yōu)勢(shì)是節(jié)省能源。電力是一種寶貴的資源,需要審慎分配。GPU 傾向于吸收更多功率,所以如果 DSP 的能效更高,效果相似,那么最好是利用后者。
需要說明的是,在執(zhí)行某些任務(wù)時(shí),并不是芯片組本身決定要使用哪個(gè)內(nèi)核。Brotman 說:“今天,這取決于開發(fā)者或 OEMs 的運(yùn)行方式?!背绦騿T可以使用支持的庫(kù),比如谷歌的 TensorFlow(或者更確切地說,它的 Lite 移動(dòng)版本)支持的庫(kù)來指定在哪些內(nèi)核上運(yùn)行他們的模型。
高通、華為和蘋果都在使用 TensorFlow Lite 和 Facebook 的 Caffe2 這樣最受歡迎的神經(jīng)網(wǎng)絡(luò)庫(kù)。高通還支持較新的開放神經(jīng)網(wǎng)絡(luò)交換(ONNX),而蘋果通過其核心的 ML 框架為更多機(jī)器學(xué)習(xí)模型增加兼容性。
到目前為止,這些芯片都沒有帶來很明顯的好處。不管芯片制造商吹噓他們自己的測(cè)試結(jié)果和基準(zhǔn),這些最終都是毫無意義的,直到人工智能成為我們?nèi)粘I钪懈匾囊徊糠?。我們正處于設(shè)備上機(jī)器學(xué)習(xí)的早期階段,而且使用新硬件的開發(fā)人員寥寥無幾。
不過,顯而易見的是,這場(chǎng)使在設(shè)備上執(zhí)行機(jī)器學(xué)習(xí)相關(guān)的任務(wù)更快,更省電的競(jìng)賽正在進(jìn)行。我們只需要再等一段時(shí)間,就能看到這個(gè)架構(gòu)對(duì) AI 的真正好處。
更多相關(guān)內(nèi)容,歡迎點(diǎn)擊人工智能繼續(xù)閱讀!
與非網(wǎng)編譯內(nèi)容,未經(jīng)許可,不得轉(zhuǎn)載!