2023年,萬象更新,AI芯片產(chǎn)業(yè)亦恢復(fù)生機(jī)。
在生成式人工智能(AIGC)熱潮的催化下,澎湃旺盛的研發(fā)和應(yīng)用需求,令算力產(chǎn)業(yè)空前興奮,連帶著AI芯片產(chǎn)業(yè)也鉚足干勁,蓄勢待發(fā)。
作為構(gòu)筑AI芯片大廈的“磚瓦”,神經(jīng)網(wǎng)絡(luò)處理器(NPU)的設(shè)計會影響AI推理的性能、能效、靈活性、易擴(kuò)展性、安全性。智能計算的多元化場景,正在改變新一代NPU的設(shè)計理念。
沖在前線的安謀科技,剛剛交出新的答卷。
智東西3月28日報道,今日,國內(nèi)頭部芯片IP設(shè)計與服務(wù)供應(yīng)商安謀科技推出其自研人工智能(AI)產(chǎn)品線的最新AI處理器產(chǎn)品——“周易”X2 NPU,將支持的算力提至最高320TOPS,針對車載、電腦、手機(jī)等特定場景做了性能優(yōu)化,并正式發(fā)布NPU軟件開源計劃。
▲安謀科技“周易”NPU路線圖
AI應(yīng)用熱潮日漸高漲,正值國際形勢日益復(fù)雜,這些推力共同將國產(chǎn)AI芯片領(lǐng)入難得的歷史機(jī)遇期。從降低設(shè)計成本、縮短開發(fā)周期、加速產(chǎn)品走向規(guī)?;涞氐冉嵌瓤紤],企業(yè)基于NPU研發(fā)加速AI計算的芯片需求預(yù)計將旺盛生長。
在愈發(fā)熱鬧的AI算力軍備競賽中,安謀科技的打法是一邊通過本土研發(fā)創(chuàng)新抬高NPU的技術(shù)壁壘,另一邊借助開源力量攜手更多伙伴共建更好用的軟件工具,以更開闊的視野來做大本土NPU生態(tài)。
安謀科技執(zhí)行副總裁、產(chǎn)品研發(fā)負(fù)責(zé)人劉澍向智東西透露,除前述軟件開源外,安謀科技后續(xù)還將逐步開放更多資源。合作伙伴在軟件層面加入“周易”軟件開源計劃,硬件層面則兼容“周易”架構(gòu),以便企業(yè)基于“周易”架構(gòu)開發(fā)全新NPU產(chǎn)品。這將催生更廣泛的芯片設(shè)計創(chuàng)新。
目前,“周易”X2 NPU已面向客戶正式交付,今年會有多款搭載該NPU的芯片產(chǎn)品面世。
01.ChatGPT帶飛異構(gòu)計算 如何影響終端NPU算力擴(kuò)展?
發(fā)展通用人工智能是計算機(jī)行業(yè)一直以來的偉大夢想,而大模型與生成式AI取得的突破性進(jìn)展,正以日新月異的速度縮短現(xiàn)實與想象之間的距離,也正重新制定AI芯片的規(guī)則。
“在應(yīng)用層面,ChatGPT把數(shù)據(jù)處理的熱度推向一個高峰。”安謀科技執(zhí)行副總裁、產(chǎn)品研發(fā)負(fù)責(zé)人劉澍告訴智東西,ChatGPT的背后結(jié)合了知識圖譜、數(shù)據(jù)庫、數(shù)據(jù)收集和分析等一整套技術(shù)體系,開創(chuàng)了很多NPU在不同行業(yè)應(yīng)用的窗口和前景,并帶動NPU、CPU、GPU等多種異構(gòu)算力的結(jié)合。
動輒參數(shù)規(guī)模上億的AI模型大多訓(xùn)練和運行于云上??蒲腥藛T正在探索如何將它們放到性價比更高的終端硬件上。最近十幾天,國內(nèi)外研究人員已經(jīng)成功實現(xiàn)用單張消費級顯卡、蘋果M1/M2芯片跑大型語言模型,展現(xiàn)了在性價比更高的終端硬件上運行認(rèn)知智能的可能性。
近年來,智能汽車、AIoT等產(chǎn)業(yè)智能化進(jìn)程提速。一方面,智能汽車、邊緣計算、智能家居、移動設(shè)備等對AI處理圖像分辨率的要求越來越高;另一方面,AI正與各行各業(yè)的典型應(yīng)用場景相融合,并逐步向傳統(tǒng)To B端產(chǎn)業(yè)滲透。
相比將所有計算放在云上,終端NPU處理能夠降低數(shù)據(jù)傳輸造成的延時,節(jié)省大量開銷。特別是對于視覺、語音等人機(jī)交互以及自動駕駛等對實時處理要求嚴(yán)苛的應(yīng)用場景,終端NPU的發(fā)展是必然且必須的。
據(jù)劉澍觀察,為了適應(yīng)下游AI算法的發(fā)展,未來終端算力可能有兩個發(fā)展路徑:一是終端算力越來越強(qiáng),終端算力的持續(xù)擴(kuò)展是未來趨勢,但會受限于成本和功耗;二是不斷為終端裁剪網(wǎng)絡(luò),這是安謀科技長期在做的嘗試,通過量化剪裁等措施將模型變得更小。
兩者相互并進(jìn),通過將云端的算法模型優(yōu)化到位,實現(xiàn)其在擁有更高算力的終端的部署。
沿著這些思路,安謀科技打造了能夠兼顧多元化算力需求的新一代AI處理器“周易”X2 NPU。
▲“周易”X2 NPU概覽
02.“周易”X2 NPU升級:更高算力、更多精度,支持差異化定制
“周易”X2 NPU基于第三代“周易”架構(gòu),支持多核Cluster,子系統(tǒng)最高算力可達(dá)320TOPS。
▲第三代“周易”架構(gòu)的可擴(kuò)展性
在精度方面,該NPU支持更多的浮點格式以及int4/int8/int12/int16/int32、fp16/bf16/fp32多精度融合計算,將計算效率與密度顯著提升,從而更好支持通用算法。
在靈活性方面,“周易”X2 NPU在支持自定義算子、滿足各種模型部署需求的基礎(chǔ)上,還面向各類應(yīng)用場景提供定制化AI解決方案,以進(jìn)一步滿足客戶在智能駕駛、手機(jī)影像AI處理、人機(jī)交互等場景中的差異化需求。
▲“周易”X2 NPU主要功能升級
“周易”X2 NPU針對高級駕駛輔助系統(tǒng)(ADAS)、智能座艙、平板電腦、臺式機(jī)、手機(jī)等應(yīng)用場景做了大量的性能優(yōu)化,可大幅提升手機(jī)拍照、錄像中的高分辨率圖像處理能力,以及車載中常用的Transformer等應(yīng)用的性能,同時采用i-Tiling技術(shù)大幅減少帶寬需求,進(jìn)一步提升計算效率。
▲相比其他汽車SoC和“周易” X1 SoC,在“周易” X2 SoC上跑Swin-Transformer模型的性能顯著提升
劉澍強(qiáng)調(diào)說,整個“周易”NPU體系,包括指令集架構(gòu)設(shè)計,全部由安謀科技本土研發(fā)團(tuán)隊完成。在面對國內(nèi)客戶對于NPU產(chǎn)品以及AI相關(guān)需求時,本土團(tuán)隊可以更及時、深入地捕捉和理解客戶需求,響應(yīng)速度也更快。
▲“周易”X2 NPU增強(qiáng)了可擴(kuò)展能力
做NPU研發(fā),拼的是長期投入。作為一家獨立運營、中資控股的合資公司,安謀科技從2018年創(chuàng)立起就一直立足于本土創(chuàng)新,堅持開展自研IP和發(fā)展Arm IP業(yè)務(wù)并重的路線,至今已有超過370家國內(nèi)授權(quán)客戶,累計芯片出貨量突破300億片。
劉澍談道,此前芯片業(yè)的相互合作溝通相對欠缺,在未來前景戰(zhàn)略的想法上各自為戰(zhàn),而芯片IP公司能夠?qū)膽?yīng)用層、軟件層到芯片層的整個產(chǎn)業(yè)鏈的需求與發(fā)展思路進(jìn)行對齊統(tǒng)一,通過打造通用的硬件及軟件工具,滿足更廣泛的市場需求。
一家芯片IP公司的基因就好比一個產(chǎn)業(yè)各方所共享的研發(fā)中心,安謀科技的核心任務(wù)是為半導(dǎo)體產(chǎn)業(yè)提供一整套可共用的異構(gòu)計算平臺,基于自己所擅長的能力定位來做更多業(yè)務(wù)上的探索與創(chuàng)新。同時,安謀科技也起到與國際接軌的橋梁作用,可將一些在國際上已被驗證過的或者正在發(fā)生的新技術(shù)趨勢帶到中國。
從自研產(chǎn)品線來看,安謀科技正不斷完善自研矩陣版圖,同步推進(jìn)CPU、NPU、ISP、VPU、SPU等各類IP產(chǎn)品線的研發(fā)。此前其自研產(chǎn)品已向160家本土客戶授權(quán),基于安謀科技自研IP的芯片出貨量超過2億顆。
據(jù)劉澍透露,隨著自研IP矩陣的日漸豐富,近兩年,安謀科技愈發(fā)注重各類自研IP之間的協(xié)同,希望將所有視覺和多媒體相關(guān)IP聚攏。其具體優(yōu)化可分為三個層面:
其一,考慮不同類型IP之間的數(shù)據(jù)格式、吞吐量、處理能力等相匹配。
其二,優(yōu)化這些IP所支持的格式對DDR帶寬的要求,在有些特定場景或大規(guī)模場景下盡量減少甚至可以不用進(jìn)行對總線和DDR來回導(dǎo)數(shù)據(jù)的訪問,從而將系統(tǒng)壓力降到極低,更加節(jié)省功耗。
其三,面向特定應(yīng)用場景實現(xiàn)不同類型IP之間的相互協(xié)同與創(chuàng)新,比如通過NPU幫助ISP去噪,對識別場景進(jìn)行快速對焦和尋找一些熱點區(qū)域等。
“我們在解決完了從0到1,就開始去考慮1+1能不能大于2,”劉澍說,“這是一個不斷嘗試的過程,我們還沒有做到非常完善,但一些協(xié)同效應(yīng)正在一步步被實現(xiàn)?!?/p>
03.軟件才是殺手锏
“越來越多的人認(rèn)識到單靠NPU硬件并不能反映巨大價值,很多公司都有機(jī)會、有能力做類似的產(chǎn)品,但NPU硬件上承載的軟件和生態(tài)才是非常重要的價值體現(xiàn)。”劉澍告訴智東西。
為了幫助開發(fā)者方便快速地進(jìn)行算法移植和性能調(diào)優(yōu),“周易”X2 NPU還提供了一套完善的AI軟件平臺。
▲“周易”NPU軟件棧
這個軟件平臺支持TensorFlow、Caffe、ONNX、 PyTorch等主流AI框架,Android、Linux、RTOS、QNX等不同操作系統(tǒng),以及TVM、Arm NN的SoC異構(gòu)計算,并擁有豐富的開放接口、調(diào)試工具和Bit精度的軟件仿真平臺。
此外,安謀科技今日發(fā)布了NPU軟件開源計劃,通過開放源碼,來滿足客戶更自主、更靈活的算法移植需求,和更多開發(fā)者及合作伙伴共建國內(nèi)NPU產(chǎn)業(yè)生態(tài)。
在該開源計劃下,安謀科技率先對外開放NPU中間表示層規(guī)范、模型解析器、模型優(yōu)化器、驅(qū)動等,并向相關(guān)合作伙伴提供“周易” Compass軟件平臺,包括軟件模擬器、調(diào)試器、C編譯器等在內(nèi)的多種軟件工具。
據(jù)了解,安謀科技已分別在代碼托管平臺Gitee、GitHub上建立該項目的開源庫。上述只是“周易”NPU軟件開源計劃的第一步,安謀科技后續(xù)還將逐步開放更多資源,如模型優(yōu)化器、模型量化、算子實現(xiàn)等源代碼。
對于軟件工具而言,“能用”與“用好”是不同層次的事。劉澍認(rèn)為,通過將軟件開源及硬件架構(gòu)免費開放,開發(fā)者無需在不同的硬件平臺上進(jìn)行開發(fā),從而避免重復(fù)造輪,進(jìn)一步提升軟件開發(fā)效率,讓生態(tài)快速發(fā)展。
從成本角度考量,如果要完整做出一個比較好用的NPU,一家公司至少要投入兩三百人,涉及到硬件、芯片、軟件、上層應(yīng)用等方方面面;但如果采用第三方NPU IP,可能只需投入100多人,用以應(yīng)用層、中間層等開發(fā)。
從生態(tài)角度考量,如果上游芯片公司們各推一套自己的NPU生態(tài),那么應(yīng)用廠商可能會無所適從。而共建生態(tài)是合作共贏,在一個可復(fù)用的生態(tài)平臺上開枝散葉,并有望激起更多以前不曾想過的場景創(chuàng)新。
據(jù)他透露,安謀科技將軟件和工具鏈開源后,企業(yè)開發(fā)者可借此快速開發(fā)出自己的產(chǎn)品,或者是用這些工具結(jié)合對自家應(yīng)用的深刻理解,從軟硬件結(jié)合的角度對底層IP性能做優(yōu)化。
未來,安謀科技還計劃開放更多資源,使得芯片設(shè)計公司能夠用“周易”架構(gòu)去快速開發(fā)出自己的NPU產(chǎn)品,并推向市場。
截至目前,“周易”NPU軟件開源計劃已有第一批合作伙伴“入駐”,其中不乏來自AIoT、智能汽車、智能操作系統(tǒng)等領(lǐng)域的明星企業(yè)。這些合作伙伴均表示將基于該計劃與安謀科技繼續(xù)深化合作,加速構(gòu)建中國智能計算生態(tài)“朋友圈”。
除了NPU軟件開源計劃外,安謀科技還基于2022年7月發(fā)起的生態(tài)伙伴計劃,通過戰(zhàn)略合作、產(chǎn)品技術(shù)支持、項目協(xié)作、聯(lián)合營銷等形式,與合作伙伴共建上下游產(chǎn)業(yè)生態(tài),共同推動各領(lǐng)域軟硬件、工具鏈、行業(yè)標(biāo)準(zhǔn)以及社區(qū)聯(lián)盟等生態(tài)環(huán)節(jié)的發(fā)展。
04.結(jié)語:本土創(chuàng)新+生態(tài)構(gòu)建,撬動芯片設(shè)計“大局”
生成式AI的火爆出圈,正激發(fā)新一輪AI研發(fā)與商用熱潮。各類硬件終端智能化滲透率不斷提升,對作為底層算力基礎(chǔ)設(shè)施“大腦”的AI芯片提出了更高的要求。
快速迭代的AI算法、日趨廣泛的應(yīng)用場景,既離不開高性能NPU來提供更強(qiáng)算力支撐,也離不開易用的軟件平臺來加快芯片產(chǎn)品的部署和落地流程??梢钥吹剑恢弊咴趪鴥?nèi)芯片IP賽道前排的安謀科技,正采用迭代更強(qiáng)NPU產(chǎn)品和開放軟件源碼的并行策略,拉更多開發(fā)者及合作伙伴一起,共同加快NPU生態(tài)建設(shè)腳步。
在立足全球生態(tài)、聚焦本土需求、深耕本土創(chuàng)新的基礎(chǔ)上,安謀科技逐漸發(fā)展成產(chǎn)業(yè)鏈上下游的“黏合劑”,為提高芯片設(shè)計創(chuàng)新的效率、降低生產(chǎn)成本、優(yōu)化資源配置提供重要支撐,通過推動NPU技術(shù)創(chuàng)新和產(chǎn)業(yè)發(fā)展,為芯片公司打通走向市場的必要通路,進(jìn)而助益中國智能計算生態(tài)的創(chuàng)新與繁榮。
作者 | ZeR0
編輯 | 漠影