大家都知道,在中美脫鉤的背景下,中國希望建立一個豐富的、本土的、多樣化的半導體生態(tài)系統(tǒng)來滿足國內最大的計算消費者群體,這已經不算是什么新聞了。可以說,從超級計算系統(tǒng),到為本土最大的在線社交和零售平臺提供芯片驅動的系統(tǒng),美國的芯片制造商們都應該密切關注它們的進展,同時也必將面臨著嚴苛的考驗。
中國的頂級超級計算機——包括神威太湖之光或強大的天河 2A——充滿了從芯片到互連在內的各種本土技術。其社交媒體巨頭,包括阿里巴巴和百度,也已經在使用自己設計的芯片進行大規(guī)模的人工智能訓練和推理。
在BAT三巨頭中,同樣是中國計算領域的超大規(guī)模企業(yè)-騰訊尚未推出自己的芯片。但值得注意的是,騰訊對總部位于上海的燧原科技進行了大量投資,該公司將很快發(fā)布自 2018 年以來一直在進行開發(fā)的第一代人工智能訓練設備 DTU 1.0。在過去的三年中,燧原科技已經籌集了近 5億 美元的資金,其中的牽頭投資者便是騰訊。
這顆DTU 1.0 器件的有趣之處在于它根本沒有什么特別有趣的地方。換句話說,它并沒有試圖做任何古怪的事情。當然,這并不能表明它就是一個比較簡單的芯片,因為它有一些獨特的功能,但燧原科技并沒有采取冒險主義的路線,比如疊加多得令人難以置信的核心數(shù)量、采取一個非主流精度或模型類型,又或者在封裝技術上進行冒險。
對于我們來說,我們所關心的問題是這個器件可以用來做什么,眾所周知, GPU 不適合用于大規(guī)模的訓練。所以,上面這個問題的答案可能很簡單,騰訊作為燧原科技最為熱情的支持者,它正在建立自己的中國本土技術——顯然,騰訊希望并需要通過構建(或購買)本土人工智能硬件來追趕上同屬中國超大規(guī)模數(shù)據計算領域的兄弟公司們。
DTU 1.0一直以來都是猶抱琵琶半遮面,就在本周,我們終于在 Hot Chips 上看到了燧原科技基于 12納米 FinFET工藝的訓練SOC。下面這個圖顯示了 32 個“AI 計算核心”,分為四個集群。同時,還有另外四十個主機處理模塊沿著燧原科技自己的四個互連信道推送數(shù)據。每個設備有兩個 HBM2 模塊,帶寬為 512GB/秒。
?
可以看出,燧原科技SoC的AI部分與我們最先從英偉達看到的 TensorCore 概念有很多共同之處,現(xiàn)在它正在被部署添加到其他幾個 CPU 的設計中。 燧原科技表示,它們的器件可以在 FP32 下達到 20 teraflops。該器件還支持 FP16 和 Bfloat(均達到 80 teraflops 的峰值),并且可以支持具有 Int-32、18 和 8 位數(shù)據類型的混合精度工作負載。其中每一個都基于一個 256 張量的計算內核。
下面是張量單位的詳細介紹:
這款芯片的設計考慮了 GEMM 操作和 CNN,這正是騰訊業(yè)務之中的重點,因為它主要由視覺媒體(視頻、照片、電子商務)驅動。
這家初創(chuàng)公司提供了一款名為云隧CloudBlazer的 PCIe Gen4 加速卡,根據配置的不同,功耗在 225W 到 300W 之間,其中功耗最大的是基于開放計算項目的 OAM(開放加速模型)設計的 CloudBlazer T21。除了僅限 PCIe 的設備外,燧原科技還對系統(tǒng)進行了封裝打包,從單個節(jié)點到機架,再到具有 2D 環(huán)面互連的“pod”。
燧原科技分享了各種配置的擴展結果,顯示單卡在擴展到 160 張卡時達到 81.6%,在打包到一個節(jié)點時達到 87.8%。這與我們在 GPU 可擴展性方面所看到的大致相當,盡管它不是一個條件對等的比較。
這家初創(chuàng)公司有機會為中國的超大規(guī)模企業(yè)提供人工智能訓練業(yè)務加速,但它并非土生土長在中國,事實上它在美國也有一些根基。該公司的首席執(zhí)行官兼聯(lián)合創(chuàng)始人趙立東在舊金山灣區(qū)工作了 20 年,一直從事 GPU 的研發(fā)和產品工作,不過他并不在英偉達工作。在幫助 AMD 在中國建立研發(fā)中心之前,他有七年的時間在 AMD 為其 CPU/APU 部門研發(fā)產品。在此之前,他負責開發(fā)網絡安全設備,還曾在 S3 Inc. 從事 GPU 開發(fā)工作。
另一位聯(lián)合創(chuàng)始人、同時也是燧原科技的首席運營官張亞林曾是趙立東在 AMD 工作時的老同事,他擔任高級芯片經理和全球器件研發(fā)技術經理,同時也從事 AMD 早期 GPU 的工作。
“人工智能是未來數(shù)字經濟基礎設施的核心,也是硬技術的戰(zhàn)場,”燧原科技創(chuàng)始人兼首席執(zhí)行官趙立東說。
“作為一家技術驅動型的公司,我們已經規(guī)劃并正在全面實施未來三年的產品技術路線圖,以軟硬件系統(tǒng)聯(lián)合開發(fā)為核心進行產品迭代,建立燧原科技技術在市場上的競爭優(yōu)勢。同時,我們也會加大對人工智能領域前沿技術的探索,讓未來的創(chuàng)新賦能更大的商業(yè)價值。”
作者:Nicole Hemsoth
編譯:與非網
?