加入星計(jì)劃,您可以享受以下權(quán)益:

  • 創(chuàng)作內(nèi)容快速變現(xiàn)
  • 行業(yè)影響力擴(kuò)散
  • 作品版權(quán)保護(hù)
  • 300W+ 專業(yè)用戶
  • 1.5W+ 優(yōu)質(zhì)創(chuàng)作者
  • 5000+ 長(zhǎng)期合作伙伴
立即加入
  • 正文
    • 在通用計(jì)算賽道上落敗的光子計(jì)算
    • 光子計(jì)算成果初現(xiàn)
    • “突破”摩爾定律,徹底取代還是并行發(fā)展?
  • 相關(guān)推薦
  • 電子產(chǎn)業(yè)圖譜
申請(qǐng)入駐 產(chǎn)業(yè)圖譜

性能超最強(qiáng)GPU數(shù)百倍,摩爾定律的未來是「光」?

2021/12/29
772
閱讀需 12 分鐘
加入交流群
掃碼加入
獲取工程師必備禮包
參與熱點(diǎn)資訊討論

曾在與電子芯片競(jìng)爭(zhēng)中落后的光子芯片,正在崛起。

 

自各家芯片廠商開始將芯片微縮制程作為發(fā)展重點(diǎn)開始,業(yè)內(nèi)關(guān)于“摩爾定律是否就快走到盡頭”的討論就未停止過。

中國工程院院士許居衍曾就下一波芯片技術(shù)前瞻主題,針對(duì)CMOS和新器件、馮·諾伊曼架構(gòu)和新興架構(gòu)列舉了四類技術(shù)方向:

一類是硅CMOS 技術(shù)與馮·諾依曼結(jié)合的“硅·馮”范式;

一類是能進(jìn)入跟CMOS雷同的二值開關(guān),新器件與馮·諾伊曼架構(gòu)的結(jié)合的“類硅”模式;

另外一類是仍利用現(xiàn)有硅CMOS器件技術(shù),但不通過馮·諾依曼架構(gòu)而是通過神經(jīng)突觸傳遞,存算一體的“類腦”模式;

最后一類是以新興架構(gòu)和新器件來做的“新興”范式.

光,可以被視為最后一類新興范式中的一種,曾在與電子芯片競(jìng)爭(zhēng)中落后。而如今卻有了新的突破,有潛力成為后摩爾時(shí)代另辟蹊徑、實(shí)力強(qiáng)勁的一員。

本月,光子計(jì)算芯片公司曦智科技發(fā)布了其最新的高性能光子處理器,在單個(gè)光子中集成超過10000個(gè)光子器件,運(yùn)行1GHz系統(tǒng)時(shí)鐘,運(yùn)行特定循環(huán)神經(jīng)網(wǎng)絡(luò)速度可達(dá)目前高端GPU的數(shù)百倍,就充分驗(yàn)證了光子芯片的優(yōu)越性。

在通用計(jì)算賽道上落敗的光子計(jì)算

既然光子計(jì)算賦予芯片的性能提升要遠(yuǎn)遠(yuǎn)大于電子芯片,那么自墨子時(shí)期就已經(jīng)被人類發(fā)現(xiàn)的光,為何沒能在芯片領(lǐng)域跑贏電子呢?

曦智科技創(chuàng)始人兼CEO沈亦晨

 

曦智科技創(chuàng)始人兼CEO沈亦晨告訴雷峰網(wǎng),實(shí)際上在半導(dǎo)體剛剛起步時(shí),就有光與電兩種技術(shù)范式,只是發(fā)展一段時(shí)間后,整個(gè)行業(yè)幾乎都覆蓋到基于數(shù)字電子的計(jì)算范式上。

數(shù)字電子計(jì)算范式之所以能夠取勝,原因有二。

一方面圖靈計(jì)算的興起,包括馮·諾依曼在內(nèi)的數(shù)字芯片架構(gòu),可以讓數(shù)字芯片通過邏輯門實(shí)現(xiàn)幾乎所有的通用計(jì)算,且應(yīng)用廣泛 。

另一方面,上世紀(jì)80年代,基于邏輯門的光子數(shù)字計(jì)算與電子計(jì)算在通用計(jì)算賽道上競(jìng)爭(zhēng)時(shí),都基于晶體管做運(yùn)算,但當(dāng)電晶體管隨著制程推進(jìn)不斷微縮,越做越小時(shí),光晶體管的尺寸一致未能打破波長(zhǎng)限制,無法比100nm更小,自此落敗電子芯片。

但近些年,情況發(fā)生了轉(zhuǎn)變,尤其電子芯片發(fā)展至今,在算力、數(shù)據(jù)傳輸和存儲(chǔ)方面都遇到瓶頸,繼續(xù)在電子計(jì)算技術(shù)范式上尋求突破口步履維艱 。

算力瓶頸是第三次人工智能浪潮下最常談的問題,晶體管微縮帶來的電子隧穿現(xiàn)象,導(dǎo)致先進(jìn)制程下的晶體管功耗無法進(jìn)一步降低,因此一些公司寄希望于通過擴(kuò)大芯片面積的方式來提升算力,不過最后卻發(fā)現(xiàn),更大的面積需要更長(zhǎng)的銅導(dǎo)線,更長(zhǎng)的銅導(dǎo)線產(chǎn)生更多的熱量,因此芯片能效比并沒有隨著面積擴(kuò)大而得到太大提升。

英偉達(dá)通過電互連芯片的方式提升算力,但受限于互連帶寬,互連100顆芯片或板卡,只能達(dá)到單塊板塊的10倍算力,互連效率并不高。

而現(xiàn)在,光計(jì)算的架構(gòu)在改變。AI計(jì)算的普及也為光計(jì)算帶來了更廣闊的前景。“我們認(rèn)為,光是最適合解決這些困境的底層技術(shù)方式。”沈亦晨給出了自己的答案。

光學(xué)計(jì)算完全不同于電子計(jì)算,它以光子的信息處理為載體,依賴光硬件而非電子硬件,用光運(yùn)算代替電運(yùn)算,擅長(zhǎng)快速并行處理高度復(fù)雜的計(jì)算任務(wù)。

他認(rèn)為,一方面,光在通信領(lǐng)域已經(jīng)充分證明了自己優(yōu)越性,目前所有遠(yuǎn)距離的通信,包括數(shù)據(jù)中心服務(wù)器之間的通信,都是基于光纖傳輸,另一方面,越來越多的人工智能做線性運(yùn)算,而光的干涉本身就是線性工程,與電相比有天然優(yōu)勢(shì)。

這一答案有著強(qiáng)有力的論證,2016年,MIT博士沈亦晨所在的研究團(tuán)隊(duì)打造出了首個(gè)光學(xué)系統(tǒng),并在2017將這一成果發(fā)表在頂級(jí)期刊Nature Photonics雜志封面上。

其創(chuàng)新有二,硬件上用光干涉儀作為基本的矩陣運(yùn)算單元有效取代傳統(tǒng)電子晶體管,算法上開發(fā)了一系列在不犧牲性能條件下有效降低深度學(xué)習(xí)計(jì)算量并適應(yīng)于光子芯片的算法。

光子計(jì)算成果初現(xiàn)

這一實(shí)驗(yàn)成果的發(fā)布,啟發(fā)了全球范圍內(nèi)一大批人開始關(guān)注光子AI芯片,沈亦晨本人也從MIT團(tuán)隊(duì)走向業(yè)界,創(chuàng)辦了專注研發(fā)光子芯片相關(guān)技術(shù)的公司曦智科技(Lightelligence)。

公司成立一年半之時(shí),曦智科技成功開發(fā)出世界第一款光子芯片原型板卡,成功演示了用光子芯片運(yùn)行Google Tensorflow自帶的卷積神經(jīng)網(wǎng)絡(luò)模型來處理MNIST數(shù)據(jù)集,即使用計(jì)算機(jī)識(shí)別手寫數(shù)字的基準(zhǔn)機(jī)器學(xué)習(xí)模型處理數(shù)據(jù)集。整個(gè)模型超過95%的運(yùn)算都有在光子芯片處理完成,此原型板卡的問世向全世界證明了用光子代替電子進(jìn)行AI計(jì)算的可行性。

測(cè)試結(jié)果顯示,光子芯片處理的準(zhǔn)確率已經(jīng)接近電子芯片(97%以上)。

距離這塊原型板卡發(fā)布不到兩年,2021年12月,曦智科技又取得新進(jìn)展,發(fā)布了高性能光子計(jì)算處理——PACE(Photonic Arithmetic Computing Engine,光子計(jì)算引擎)——單個(gè)光子芯片中集成超過10,000個(gè)光子器件,運(yùn)行1GHz系統(tǒng)時(shí)鐘,運(yùn)行特定循環(huán)神經(jīng)網(wǎng)絡(luò)速度可達(dá)目前高端GPU的數(shù)百倍。

 

“相比于2019年推出的那款原型板卡,我們的PACE在光子器件的集成度上大約提高了兩個(gè)數(shù)量級(jí),從100個(gè)光子器件到10000個(gè)光子器件;運(yùn)行系統(tǒng)時(shí)鐘提高四個(gè)數(shù)量級(jí),基本達(dá)到目前電子芯片的時(shí)鐘。”沈亦晨說道。

 

值得注意的是,PACE并不是純粹的光子芯片,PACE包含64x64 的光學(xué)矩陣,核心部分由一款集成硅光芯片和一塊CMOS微電子芯片以3D封裝形式倒裝堆疊而成。其中,電芯片主要用作數(shù)據(jù)存儲(chǔ)和數(shù)?;旌险{(diào)度,光芯片主要用作數(shù)據(jù)計(jì)算。

“我們認(rèn)為,電存儲(chǔ)技術(shù),尤其在高速存儲(chǔ)讀取方面,會(huì)在很長(zhǎng)一段時(shí)間之內(nèi)領(lǐng)先于光。這也是我們采用光電協(xié)同的原因。”沈亦晨解釋道。

PACE運(yùn)行時(shí),每個(gè)輸入向量值首先從片上存儲(chǔ)中提取,由數(shù)模轉(zhuǎn)換器轉(zhuǎn)換為模擬值,通過電子芯片和光子芯片之間的微凸點(diǎn)應(yīng)用于相應(yīng)的光調(diào)制器,形成輸入光矢量。

 

接著,輸入光矢量通過光矩陣完成運(yùn)算傳播,產(chǎn)生輸出光矢量,并達(dá)到一組光電探測(cè)器陣列,從而將光強(qiáng)轉(zhuǎn)換為電流信號(hào)。

最后,電信號(hào)通過微凸點(diǎn)返回到電子芯片,通過跨阻放大器模數(shù)轉(zhuǎn)換器返回?cái)?shù)字域。

沈亦晨表示,曦智科技所使用的光調(diào)制器,是基于馬赫曾德干涉儀方案做光與光之間的干涉,并同算法協(xié)同優(yōu)化的小尺寸高速可調(diào)的光調(diào)制器。由于光在傳播時(shí)不放熱,完成矩陣運(yùn)算花費(fèi)時(shí)間少,延時(shí)低于電芯片,矩陣乘法并行能力更強(qiáng)。

PACE采用迭代法來解決全球難以高效解決的數(shù)學(xué)問題——多項(xiàng)式復(fù)雜程度非確定性問題,涉及生物信息中蛋白質(zhì)結(jié)構(gòu)預(yù)測(cè),物流交通調(diào)度、材料研發(fā)等問題,商業(yè)應(yīng)用前景廣闊。

曦智科技也做出了自己產(chǎn)品規(guī)劃,計(jì)劃在自2022年開始的1到3年內(nèi),在對(duì)算力、延時(shí)痛點(diǎn)強(qiáng)的應(yīng)用場(chǎng)景落地,例如金融和云服務(wù)廠商,之后加強(qiáng)對(duì)訓(xùn)練市場(chǎng)的布局,最后延伸至GPU、車載芯片等市場(chǎng)。

“突破”摩爾定律,徹底取代還是并行發(fā)展?

事實(shí)上, 除曦智科技外,也有不少大廠開始投入光子計(jì)算芯片的研發(fā)。據(jù)了解,華為、英特爾、英偉達(dá)目前都有入局光子計(jì)算。

光子計(jì)算賽道上的玩家越來越多,是否意味著,在未來,光子計(jì)算芯片將有能力徹底取代電子芯片,“突破“摩爾定律?

回到對(duì)摩爾定律的討論上,盡管光子計(jì)算是另一條截然不同的技術(shù)路線,但硅光芯片依然基于傳統(tǒng)的CMOS工藝,依賴現(xiàn)有的生態(tài)、固件軟件就能滿足基本的設(shè)計(jì)需求。工藝制造方面,只需要在步驟上稍作修改,例如在光的探測(cè)器制造方面引入其他新設(shè)備。

此前基于光的晶體管體積龐大,在與電子計(jì)算的競(jìng)爭(zhēng)中落敗,但如今光子計(jì)算改變了原先使用晶體管與電子計(jì)算競(jìng)爭(zhēng)的路徑,利用在線性運(yùn)算上的優(yōu)勢(shì)做光學(xué)器件,一個(gè)光學(xué)器件的運(yùn)算性能相當(dāng)于上千個(gè)電晶體管,且65nm或45nm的CMOS工藝制程就能滿足現(xiàn)有光芯片的所有制程要求,哪怕是在未來,硅光技術(shù)迭代也不會(huì)對(duì)制程要求特別嚴(yán)苛,更多是主頻、波長(zhǎng)方面的迭代。

這意味著,哪怕摩爾定律已經(jīng)逼近物理極限,對(duì)光子計(jì)算芯片也不會(huì)有太大影響。不過這并不意味著光子芯片能夠完全取代電子芯片。

沈亦晨表示,在可預(yù)見的未來范圍內(nèi),都是光子與電子芯片深度結(jié)合的光電混合運(yùn)算,曦智科技的光電混合芯片與客戶的交互都是通過電芯片來完成的,所有的指令編譯器SDK都承載在電芯片上。與電芯片相比,光芯片主要承載線性計(jì)算和數(shù)據(jù)網(wǎng)絡(luò)兩大部分,電芯片的好處在于與現(xiàn)有的市場(chǎng)環(huán)境、軟件環(huán)境互相兼容。

“光與電的關(guān)系就好比新能源汽車和燃油汽車,只是在引擎和電池方面有所改變,諸如輪胎之類的器件依然相同,將有效地與現(xiàn)有使用場(chǎng)景兼容。光不會(huì)完全取代電。”沈亦晨說道。

作者 | 吳優(yōu)

編輯 | 包永剛

相關(guān)推薦

電子產(chǎn)業(yè)圖譜