數(shù)據(jù)是信息社會(huì)的基礎(chǔ),它是二進(jìn)制世界的硬通貨,也是驅(qū)動(dòng)數(shù)字經(jīng)濟(jì)發(fā)展的動(dòng)力之源。信息技術(shù)歸根到底就是如何采集、傳輸和處理數(shù)據(jù)的技術(shù),近幾十年引領(lǐng)科技進(jìn)步的商業(yè)公司前赴后繼所從事的,基本都是如何從恒河沙數(shù)的數(shù)據(jù)中煉金的工作,英特爾也不例外。
數(shù)據(jù)洪流
“英特爾永遠(yuǎn)是一個(gè)處理數(shù)據(jù)的公司,”英特爾全球副總裁兼中國(guó)區(qū)總裁楊旭說(shuō)道。在 2016 英特爾人工智能論壇上, 楊旭發(fā)表了《人工智能在中國(guó)》的主題演講,他表示英特爾公司多年來(lái)持續(xù)跟蹤數(shù)據(jù)處理技術(shù)的發(fā)展,全面布局?jǐn)?shù)據(jù)處理核心領(lǐng)域,認(rèn)真應(yīng)對(duì)數(shù)據(jù)特征變化。他認(rèn)為,人工智能的再次火爆,正是由于洶涌而來(lái)的數(shù)據(jù)洪流達(dá)到了一定“水位”所催生。
以 1956 年在達(dá)特茅斯學(xué)院舉行的人工智能會(huì)議為起點(diǎn),現(xiàn)代人工智能技術(shù)已經(jīng)問(wèn)世六十年,起起伏伏的人工智能產(chǎn)業(yè)并非一帆風(fēng)順。以往人工智能技術(shù)所取得的成就在學(xué)術(shù)與研究上的意義更大,產(chǎn)生的直接經(jīng)濟(jì)效益并不明顯,楊旭就認(rèn)為人工智能產(chǎn)業(yè)仍處于嬰兒期?!叭斯ぶ悄苓€沒(méi)有產(chǎn)生很多直接的經(jīng)濟(jì)效益,”英特爾公司副總裁兼數(shù)據(jù)中心事業(yè)部數(shù)據(jù)中心解決方案部門(mén)總經(jīng)理 Jason Waxman 也這么說(shuō),“但所有的行業(yè)都能利用人工智能技術(shù)創(chuàng)造更大的經(jīng)濟(jì)效益,只是時(shí)間上早晚的問(wèn)題。”
英特爾公司副總裁兼數(shù)據(jù)中心事業(yè)部數(shù)據(jù)中心解決方案部門(mén)總經(jīng)理 Jason Waxman
越來(lái)越多的證據(jù)表面,當(dāng)前的計(jì)算能力、算法與聯(lián)網(wǎng)設(shè)備所產(chǎn)生的數(shù)據(jù)量已經(jīng)構(gòu)成了人工智能真正崛起的基礎(chǔ)。除了在圍棋領(lǐng)域戰(zhàn)勝人類冠軍,在圖像識(shí)別和語(yǔ)音識(shí)別正確率上,機(jī)器性能也在近年超過(guò)了人類平均水平,這既是算法改進(jìn)的功勞,又離不開(kāi)大量的訓(xùn)練數(shù)據(jù)和計(jì)算。
在圖像識(shí)別上機(jī)器已經(jīng)超越人類水平
海量接入的聯(lián)網(wǎng)設(shè)備所造成的數(shù)據(jù)洪流究竟有多大?“‘人聯(lián)網(wǎng)’時(shí)代,我們使用手機(jī)、電腦等終端設(shè)備,每人平均每天產(chǎn)生 1.5 GB 的數(shù)據(jù)量。而到了物聯(lián)網(wǎng)時(shí)代,一家智能醫(yī)院每天產(chǎn)生 3,000 GB 的數(shù)據(jù)量,一輛無(wú)人駕駛汽車(chē)每天產(chǎn)生 4,000 GB 的數(shù)據(jù)量,一家智能制造工廠每天將產(chǎn)生 1,000,000 GB 的數(shù)據(jù)量,完全不可想象的龐大數(shù)據(jù)流正在產(chǎn)生。”
楊旭同時(shí)強(qiáng)調(diào),大數(shù)據(jù)時(shí)代中國(guó)在很多領(lǐng)域都非常領(lǐng)先,“中國(guó)互聯(lián)網(wǎng)用戶數(shù)達(dá)到了 4.2 億,全球最多,機(jī)動(dòng)車(chē)擁有量達(dá)到了 2.85 億部,滴滴等網(wǎng)上訂車(chē)應(yīng)用每天的數(shù)據(jù)量是 70TB,剛剛過(guò)去的雙十一創(chuàng)造了 1800 億元的銷售額。”中國(guó)一定是人工智能產(chǎn)業(yè)的主戰(zhàn)場(chǎng)之一。
主要矛盾
人工智能或整個(gè)信息技術(shù)的主要矛盾,就是系統(tǒng)日益增長(zhǎng)的數(shù)據(jù)處理壓力與計(jì)算能力之間的矛盾?,F(xiàn)在人工智能領(lǐng)域比較火爆的圖像視頻應(yīng)用與無(wú)人駕駛等都是計(jì)算壓力非常大的應(yīng)用,戰(zhàn)勝李世石的 Alpha Go 分布式版本就采用了 1920 個(gè) CPU 與 280 個(gè) GPU,人工智能應(yīng)用對(duì)于計(jì)算能力的需求非常驚人。
以人臉識(shí)別為例,英特爾數(shù)據(jù)中心事業(yè)部副總裁兼人工智能解決方案部門(mén)總經(jīng)理 Naveen Rao 講解了為何機(jī)器學(xué)習(xí)或深度學(xué)習(xí)需要大計(jì)算量。與人類和動(dòng)物不同,機(jī)器無(wú)法判斷圖像上哪些部位是特征點(diǎn),這就需要開(kāi)發(fā)人員用算法將圖像的關(guān)鍵點(diǎn)進(jìn)行提取分類,對(duì)機(jī)器進(jìn)行訓(xùn)練,只有大量的數(shù)據(jù)與計(jì)算才能完成訓(xùn)練,“從數(shù)據(jù)里面提取特征出來(lái)需要大量的計(jì)算,在過(guò)去,深度學(xué)習(xí)可能要花幾個(gè)月或者幾年的時(shí)間來(lái)能完成,這是因?yàn)楫?dāng)時(shí)計(jì)算能力很有限?!奔幢闶歉倪M(jìn)的端到端深度學(xué)習(xí)算法所需處理的參數(shù)仍然有約 6000 萬(wàn)個(gè)。
深度學(xué)習(xí)計(jì)算量驚人
“Pikazo 對(duì)內(nèi)存的消耗非常大,最初的版本渲染一張 3.5 兆的圖片大概需要一個(gè)小時(shí)的時(shí)間?!盤(pán)ikazo 應(yīng)用的寧飛說(shuō),“這種動(dòng)輒數(shù)十分鐘的渲染時(shí)間,肯定非常影響用戶體驗(yàn)?!辈捎?Torch 深度學(xué)習(xí)框架的 Pikazo 可以將照片渲染成藝術(shù)畫(huà),但由于便攜設(shè)備計(jì)算能力不足,只能將計(jì)算放在云端,大計(jì)算量所需數(shù)十分鐘的處理時(shí)間很難讓普通用戶接受這款應(yīng)用。
“我們都知道,只有更強(qiáng)大的計(jì)算能力才能處理人工智能應(yīng)用所需的大數(shù)據(jù),”Jason Waxman 說(shuō),“英特爾預(yù)測(cè),到 2020 年,用于人工智能的計(jì)算將比現(xiàn)在增長(zhǎng) 12 倍。”他還表示,隨著信息產(chǎn)業(yè)發(fā)展得愈加成熟,人工智能應(yīng)用整體框架的部署變得越來(lái)越困難,因?yàn)楹芏嘣械幕A(chǔ)架構(gòu)并沒(méi)有考慮到去適應(yīng)人工智能應(yīng)用,“只有 7%的應(yīng)用部署符合人工智能的要求。”
巨頭布局
還不成熟的人工智能已經(jīng)在多個(gè)領(lǐng)域顯示出了巨大的潛力?!袄萌斯ぶ悄芗夹g(shù)構(gòu)建的欺詐檢測(cè)系統(tǒng),每年避免了數(shù)十億美元的損失,金融機(jī)構(gòu)、政府和我們普通人都是受益者?!盝ason Waxman 說(shuō),“自動(dòng)駕駛更是一個(gè)萬(wàn)億美元級(jí)別的市場(chǎng),無(wú)論是金融服務(wù)、制造業(yè)、工業(yè)、醫(yī)療還是汽車(chē),都將受益于人工智能技術(shù),人工智能的經(jīng)濟(jì)效益在未來(lái)五到十年將真正體現(xiàn)出來(lái)?!?/p>
人工智能技術(shù)是人類對(duì)智力疆域的一次哥倫布之旅,是智力層面的“蒸汽機(jī)革命”,正在顛覆或者準(zhǔn)備顛覆很多現(xiàn)有的行業(yè)與行業(yè)領(lǐng)袖。以筆者所從事的媒體行業(yè)為例,根據(jù)《智媒來(lái)臨和人機(jī)邊界:中國(guó)新媒體趨勢(shì)報(bào)告(2016)》中的數(shù)據(jù),財(cái)經(jīng)機(jī)器人寫(xiě)稿量在 2016 年第一季度僅為 400 篇,2016 年第三季度已經(jīng)達(dá)到了 40000 篇。
黑云壓城,山雨欲來(lái),如果現(xiàn)在不主動(dòng)應(yīng)對(duì),將來(lái)只能被動(dòng)應(yīng)付,所以行業(yè)巨頭在人工智能方面的布局出現(xiàn)了加速的趨勢(shì),而且犬牙交錯(cuò),互不相讓,谷歌要開(kāi)發(fā)專用于機(jī)器學(xué)習(xí)的張量處理器(Tensor Processing Unit),英特爾也提供了從底層原語(yǔ)、中層框架到上層應(yīng)用的各種軟件解決方案。在應(yīng)用上,英特爾現(xiàn)在重點(diǎn)布局的是精準(zhǔn)醫(yī)療、金融服務(wù)、自動(dòng)駕駛與網(wǎng)絡(luò)安全等應(yīng)用。
Lake Crest 大概是英特爾版的張量處理器(TPU)
在一年左右的時(shí)間里,英特爾先后購(gòu)入的 Saffron Technology、Nervana Systems 和 Movidius(尚未結(jié)案)都是為了完善自己的人工智能布局,Nervana Systems 的創(chuàng)始人 Naveen Rao 成為英特爾新成立的人工智能解決方案部門(mén)總經(jīng)理,由他來(lái)掌舵 Nervana 人工智能平臺(tái)的發(fā)展方向。
Naveen Rao 掌控英特爾新成立的人工智能部門(mén)
新 Nervana 平臺(tái)將是一個(gè)整合性的人工智能產(chǎn)品組合,既包括現(xiàn)有的 Nervana 硬件平臺(tái)(至強(qiáng)(Xeon)處理器、至強(qiáng)融芯(Xeon PHI)、至強(qiáng)配合 FPGA 解決方案等)與人工智能軟件方案,也包含了規(guī)劃中的專為深度學(xué)習(xí)應(yīng)用而開(kāi)發(fā)的獨(dú)立加速芯片 Lake Crest 和面向神經(jīng)網(wǎng)絡(luò)的 Nervana 圖編譯器。
Nervana 產(chǎn)品平臺(tái)
英特爾中國(guó)研究院院長(zhǎng)宋繼強(qiáng)將英特爾的人工智能方案總結(jié)為:從前端到后端、從底層到上層完整的堆棧解決方案。
英特爾人工智能解決方案一覽
洞見(jiàn)未來(lái)
事實(shí)上,由于當(dāng)前絕大部分人工智能應(yīng)用對(duì)計(jì)算密度和存儲(chǔ)性能等要求極高,所以現(xiàn)在人工智能應(yīng)用多部署在數(shù)據(jù)中心上,這正是英特爾的強(qiáng)項(xiàng)。
“目前 90%以上的數(shù)據(jù)分析都在用英特爾至強(qiáng)處理器平臺(tái),其中在人工智能與深度學(xué)習(xí)的方案或者部署方面,至強(qiáng)處理器的占有率也超過(guò) 90%?!彼卫^強(qiáng)表示,利用 Nervana 技術(shù)可以更高效地定義內(nèi)存訪問(wèn)帶寬和計(jì)算密度,Nervana 平臺(tái)能夠非常好地匹配人工智能應(yīng)用不斷增長(zhǎng)的數(shù)據(jù)處理能力需求。“Nervana 可以讓多個(gè)節(jié)點(diǎn)并行支持大模型的訓(xùn)練,從而實(shí)現(xiàn)一種近乎線性的學(xué)習(xí)性能擴(kuò)展?!?/p>
并行架構(gòu)中處理器性能不是系統(tǒng)限制,通信開(kāi)銷決定了系統(tǒng)上限
英特爾還在積極搶占 GPU 的市場(chǎng),Pikazo 應(yīng)用最初的版本采用 GPU 處理,最新的版本服務(wù)器已經(jīng)更換為英特爾至強(qiáng)處理器,“Pikazo 的處理速度提高了至少 28 倍,能夠渲染的最大圖片尺寸提高了 15 倍”從寧飛現(xiàn)場(chǎng)的演示來(lái)看,渲染時(shí)間確實(shí)只需要幾分鐘。
Pikazo 現(xiàn)場(chǎng)演示
收購(gòu) Movidius 以后,在終端方面,英特爾也有了卷積神經(jīng)網(wǎng)絡(luò)(CNN)的解決方案。從硬件到軟件、從前端到后端、從底層到上層,這樣英特爾對(duì)人工智能實(shí)現(xiàn)了全面覆蓋。
利用 Movidius,英特爾將人工智能延伸到終端設(shè)備
?
但在人工智能上英特爾是否可以高枕無(wú)憂?未必,如果人工智能真的是顛覆性科技,那么它的成功必然是以一批初創(chuàng)公司崛起,并拿此時(shí)輝煌的科技巨頭們祭旗為標(biāo)志。在技術(shù)產(chǎn)業(yè)化經(jīng)驗(yàn)上,初創(chuàng)公司遠(yuǎn)不能與英特爾、谷歌等大公司相比,但大公司的問(wèn)題往往在于當(dāng)前的利益遮擋住了未來(lái)的路標(biāo),內(nèi)部的糾紛耗盡了有限的資源。
人工智能本來(lái)就是一個(gè)從現(xiàn)有數(shù)據(jù)中推測(cè)未來(lái)的技術(shù),深度介入深度學(xué)習(xí)的科技巨頭所卜筮的結(jié)果是什么?能從已有模式中洞見(jiàn)自己的未來(lái)嗎?