昨天,英特爾年度戰(zhàn)略“紛享會”在線上舉辦,在會上英特爾中國研究院院長宋繼強發(fā)表主題演講《凌云之智:驅(qū)動智能時代的技術(shù)創(chuàng)新》,英特爾近期的關(guān)鍵進展,以及在計算方式、連接方式以及存儲方式三個領(lǐng)域的全面布局。
過去二十年到未來的五年,數(shù)據(jù)從規(guī)模、形態(tài)到處理需求都在發(fā)生巨大的變革。第一,數(shù)據(jù)量呈指數(shù)級爆發(fā)。第二,數(shù)據(jù)形態(tài)日趨多樣化。第三,數(shù)據(jù)實時處理的需求也在不斷增長。人工智能的原數(shù)據(jù)及其產(chǎn)生的模型并不是給人看的,是給機器使用的,這個數(shù)據(jù)量是非常巨大的。萬物互聯(lián)之后,機器產(chǎn)生的數(shù)據(jù)也在大幅度上升。這些數(shù)據(jù)遠遠超出網(wǎng)絡和云端處理的能力,不可能都送到數(shù)據(jù)中心云端處理。數(shù)據(jù)在哪里產(chǎn)生就要靠近數(shù)據(jù)源進行處理。因此,邊緣計算和實時處理的需求也是快速增長的。
在數(shù)據(jù)的變革驅(qū)動之下,計算的發(fā)展呈現(xiàn)出三個顯著的趨勢。第一,數(shù)據(jù)量呈爆發(fā)式增長,這使得對于智能化的需求激增;第二,多元化的數(shù)據(jù)形態(tài)和工作負載,許多是非結(jié)構(gòu)化的數(shù)據(jù),一種架構(gòu)無法滿足所有需求,計算必須更加多元化;第三,未來大量設(shè)備是在物理世界中捕捉數(shù)據(jù)進行實時處理的,數(shù)據(jù)從云端到邊緣到設(shè)備都有處理和存儲的需求。因此,邊緣的智能化正在全面展開。
宋繼強表示,“英特爾對于未來計算的研究和布局,將緊密圍繞數(shù)據(jù)展開。我們認為,未來計算的顛覆性效應將會在三個維度發(fā)生,即計算方式、通信方式以及存儲方式。面向智能時代,英特爾的指數(shù)級創(chuàng)新將在三個層面發(fā)生,分別是通過智能連接讓數(shù)據(jù)傳輸得更快,通過智能存儲去存儲更多數(shù)據(jù),通過智能計算去處理各種各樣的數(shù)據(jù)?!?/p>
從新型計算的角度來看,量子計算、神經(jīng)擬態(tài)計算將是兩種重要的新型計算方式;從數(shù)據(jù)通信的方式來看,硅光子將是一種新的互聯(lián)方式;從存儲或者內(nèi)存技術(shù)來看,英特爾認為讓數(shù)據(jù)盡可能地靠近計算,是未來數(shù)據(jù)處理最迫切的需求,讓內(nèi)存和計算資源更緊密地結(jié)合在一起,將讓大規(guī)模數(shù)據(jù)處理的效率大幅攀升。
Loihi新型計算架構(gòu):讓擬態(tài)神經(jīng)成為可能
從新型計算的角度來看,量子計算、神經(jīng)擬態(tài)計算將是兩種重要的新型計算方式。針對神經(jīng)擬態(tài)計算,英特發(fā)布了 Loihi 新型計算架構(gòu),傳統(tǒng)的 CPU、GPU 擅長處理人難以處理的大規(guī)模、大數(shù)據(jù)量的并發(fā)計算。但是,隨著技術(shù)的發(fā)展和應用領(lǐng)域逐漸擴展,人們逐漸要求計算機的處理模式趨向于像人類一樣,不需要大量數(shù)據(jù),也不需要預先標注好的數(shù)據(jù)訓練它。為了應對這種挑戰(zhàn),我們需要全新的架構(gòu),同時還需要大幅度提高能效比。
Loihi 支持模擬人腦的神經(jīng)元連接構(gòu)建的單元,將計算和存儲完全融合在了一起。一個芯片中包含了 128 個核,每個里面又包含了 1000 個小的神經(jīng)元,這就構(gòu)成了一個大規(guī)模的片上計算網(wǎng)絡。同時,它可以支持多種學習模式,可以同時將深度學習、關(guān)聯(lián)學習、強化學習使用的網(wǎng)絡放在一個芯片架構(gòu)中,讓它去學習和自我擴展,這是領(lǐng)先的軟硬件協(xié)同設(shè)計的模式。
英特爾基于 Loihi 芯片可以設(shè)計出更大規(guī)模的系統(tǒng),讓它具備更強的學習能力和處理更復雜的學習應用。早期,英特爾把 4 塊 Loihi 主板聯(lián)結(jié)在一起,然后進展到可以用 32 塊、64 塊,最新已經(jīng)把 768 塊 Loihi 芯片集成在一起,做成一個大規(guī)模的神經(jīng)擬態(tài)計算系統(tǒng),這個系統(tǒng)可以在 5 個機箱大小的空間中集成 768 塊芯片,以 500W 的功耗執(zhí)行大規(guī)模的深度學習、神經(jīng)擬態(tài)學習的應用。
目前,已經(jīng)有 90 家組織加入到英特爾神經(jīng)擬態(tài)計算研究社區(qū)中。這個系統(tǒng)已經(jīng)可以給很多合作伙伴提供云上的服務,可以在上面試驗大規(guī)模的工業(yè)系統(tǒng)中如何使用神經(jīng)擬態(tài)的新架構(gòu),在更復雜的工作負載和高性能計算中實時動態(tài)處理數(shù)據(jù)。在算法方面,英特爾和美國康奈爾大學進行合作,探索讓計算機擁有嗅覺。它使用一套模擬人的嗅覺系統(tǒng)的模型架構(gòu),將它實施在一塊 Loihi 芯片上,功耗非常低。而且只用一個樣本就可以讓這個系統(tǒng)的識別率達到 92%。如果用傳統(tǒng)的深度學習方法,需要 3000 個樣本訓練才可以達到這樣的識別率,同時功耗是千倍以上。可見,Loihi 的神經(jīng)擬態(tài)架構(gòu),加上專門設(shè)計好的算法,可以讓機器學會一些原本人才能學會的事情,并且降低功耗。
量子計算:從概念走向?qū)嵱?/b>
量子計算是一種全新的計算模式,它的底層基礎(chǔ)已經(jīng)不是經(jīng)典計算中使用的具有確定性的二進制比特,而是利用量子態(tài)系統(tǒng)為基礎(chǔ),通過量子位的相干,在多個量子位上實現(xiàn)超大規(guī)模的并行計算。2015 年,英特爾宣布與荷蘭科研機構(gòu) QuTech 開展為期十年的合作計劃。之后,兩個研究方向同步在進行:第一,是超導量子位和超導量子測試芯片,英特爾發(fā)布了 49 量子位的測試芯片“Tangle Lake”。第二,是英特爾做硅電子自旋的“自旋量子芯片”?,F(xiàn)在已經(jīng)有了兩個自旋量子位的測試芯片,并且在英特爾自己的 300mm 的晶圓生產(chǎn)線上制作?,F(xiàn)在量子計算系統(tǒng)面臨的一個挑戰(zhàn)是,如何在低溫下測試晶圓上或者是量子系統(tǒng)中的量子位到底好不好?英特爾與合作伙伴一起設(shè)計并試驗了量子的低溫晶圓的測試系統(tǒng)。
宋繼強表示,英特爾持續(xù)推動量子計算,實現(xiàn)規(guī)?;纳虡I(yè)部署。如果將量子計算商業(yè)化比作“極限攀巖”,那么現(xiàn)在才剛剛啟程。我們在關(guān)注如何構(gòu)建能夠用于解決棘手挑戰(zhàn)的系統(tǒng),即“量子實用性”。只有在成千上萬個量子位可靠運行的情況下,量子計算機才能比超級計算機更快地解決實際問題。換句話說,業(yè)界要開發(fā)出這種規(guī)模的功能性量子處理器還需要數(shù)年時間。
圍繞量子計算領(lǐng)域,英特爾也正持續(xù)探索。一是要創(chuàng)造更好、更穩(wěn)定的量子位,還要提升多個量子位同時連接和測試,英特爾需要和摩爾定律的同步推動并開發(fā)出一套可擴展的 I/O 系統(tǒng)。宋繼強強調(diào),“英特爾的前沿探索,不會與目前的架構(gòu)創(chuàng)新產(chǎn)生沖突,而是一個互補的探索?!?/p>
為了實現(xiàn)在低溫下控制多個量子位,英特爾研究院剛發(fā)布了代號為“Horse Ridge”低溫控制芯片,它可以同時控制 50 個左右的量子位,而且是在 -270℃左右的低溫下去控制。這是一個里程碑,這樣可以讓量子位的控制更加集成化,為我們控制成千上萬個量子位打下基礎(chǔ)。
存儲和存儲模式的革新
當我們的計算需要很多數(shù)據(jù)時,就必須要通過內(nèi)存總線訪問數(shù)據(jù),這會造成用戶要去遠一點的內(nèi)存找數(shù)據(jù),因此造成大量的計算等待。如果能將數(shù)據(jù)和計算緊密地放在一起,就可以大大減少對內(nèi)存通道的沖突?,F(xiàn)在計算靠近內(nèi)存核心是非常核心的方向。從上圖中的一個非常小的近內(nèi)存計算單元來看,里面有 16 個乘加器組成的計算單元,同時有它自己的靜態(tài)內(nèi)存的存儲。所以,這部分的計算可以直接拿到數(shù)據(jù),不需要再占用內(nèi)存總線。同時,這是個非常小的計算單位,也可以更大量地集成在一起。在 FPGA 應用案例中,它將大量的計算單元和內(nèi)存模塊放在一起構(gòu)成了更大規(guī)模的計算系統(tǒng),同時保證內(nèi)存功耗很低。
未來通信:硅光通信
未來的通信即硅光通信,現(xiàn)在在內(nèi)存之間傳輸數(shù)據(jù)要求大帶寬、低功耗。光通信是現(xiàn)在采用較多,但是光通信和電子器件結(jié)合的時候,通常還需要一些分立器件連接起來進行轉(zhuǎn)換,這個器件會比較耗體積,也會損失一些傳輸效率。如何將電和光的轉(zhuǎn)換封在一個芯片封裝中,這非常重要。今年 3 月,英特爾向業(yè)界展示了業(yè)界首個一體封裝光學以太網(wǎng)交換機,它成功將 1.6 Tbps 的硅光引擎與 12.8 Tbps 的可編程以太網(wǎng)交換機進行了集成。
宋繼強指出,“我們認為一體封裝光學器件對于 25 Tbps 及更高速率的交換機具備功率和密度優(yōu)勢,是非常必要的技術(shù)。我們目前已經(jīng)可以為客戶提供支持?!?/p>