日前,AMD“自適應和嵌入式產品技術日”活動在蘇州舉辦,AMD 全球副總裁唐曉蕾發(fā)表了題為《“芯”科技加速創(chuàng)新落地》的主旨演講,著重介紹了自適應計算如何在汽車、工業(yè)、醫(yī)療、音視頻以及TME(測試、測量與仿真)等核心市場加速創(chuàng)新。
距去年2月AMD官宣完成對賽靈思的收購已過去一年多,從唐曉蕾的分享中可以看出,自適應計算理念和平臺技術在雙方產品基礎之上得到了更進一步的拓展,能夠在軟硬件平臺和系統(tǒng)級提供更為強大的加速計算。
AMD 全球副總裁唐曉蕾進行主題演講
汽車迭代周期加快,異構計算助力變革
整個汽車行業(yè)正面臨前所未有的改變,智能化轉型在快速進行。據(jù)唐曉蕾介紹,隨著與Tier1、OEM的交流增多,發(fā)現(xiàn)不同技術路線、落地方式都有不同的方向。其中,自動駕駛主要主要朝Robotaxi的方向發(fā)展,傳統(tǒng)汽車或新能源汽車更強調沉浸式體驗、智能駕艙以及提升駕駛員安全感。
智能座艙方面,AMD提供信息娛樂控制臺、數(shù)字集群以及乘客顯示屏來創(chuàng)造沉浸式智能座艙。其中,乘客顯示屏能夠讓乘客感到更加真實的世界,是沉浸式座艙的一個重要應用場景。
此外,安全是汽車永遠的主題,AMD在ADAS中加入前視攝像頭、車艙內監(jiān)控以及泊車、環(huán)繞視圖方案來創(chuàng)造安全行車體驗。傳感系統(tǒng)方面,AMD打造了更高級的安全傳感器并提供相應的解決方案。隨著傳感器的升級,激光雷達、4D雷達都是AMD在關注的應用領域。目前,AMD在機器出租車、最后一公里送貨車以及商用車隊等方面提供了一系列解決方案。
汽車正在經(jīng)歷從機械到電子再到智能化的巨大變革過程,汽車行業(yè)與半導體公司也正在產生前所未有的緊密耦合,以滿足發(fā)展所需的更強算力。唐曉蕾強調,這個融合過程是數(shù)據(jù)驅動的,在這個領域,AMD的獨特之處在于能夠將CPU、GPU、FPGA等芯片技術融合到一起,幫助汽車行業(yè)客戶實現(xiàn)大數(shù)據(jù)計算的轉型,并且,異構計算能夠更好地平衡功耗和算力。
“當今汽車行業(yè)很卷,迭代周期、產品升級已經(jīng)不能滿足汽車的設計周期,市場對于ASIC設計周期的需求大大加快,”唐曉蕾表示,“ AMD的自適應平臺給客戶提供了不一樣的產品設計體驗。雖然迭代速度加快、應用場景增加,我們仍然希望能提供一個可擴展的平臺給客戶使用?!?/p>
自動駕駛方面,對算力有非常高的要求。唐曉蕾認為, AMD在這個領域的優(yōu)勢在于有非常強的x86 CPU做真正的控制,并且在計算方面,CPU、GPU結合FPGA能夠使車載網(wǎng)絡更高效,能夠幫客戶不斷升級迭代以及進行自適應計算。
大模型下沉至邊緣,自適應計算如何滿足需求?
AI因ChatGPT再次成為熱門話題,唐曉蕾認為,ChatGPT只是AI的起點,大模型會隨著參數(shù)的增加和算法的提升變得更加聰明,真正讓AI改變我們的生活和世界還有很長的路要走。
“AI發(fā)展是黎明時期,盡管我們以驚人速度前進,仍然追趕不上數(shù)據(jù)的產生和對AI的需求?!碧茣岳俦硎?,“我相信對AI或對計算能力的需求,將會是未來十年對所有人的挑戰(zhàn)。這不僅涉及對能源、算力的需求,還關系到整個環(huán)境改變的需求,這是一種大勢?!?/p>
為了將靈活、高效的能力賦予AI計算,AMD打造了XDNA自適應架構IP,主要用于AI以及傳統(tǒng)的信號處理和數(shù)據(jù)流之間的架構。
據(jù)唐曉蕾介紹,XDNA帶有本地存儲器和數(shù)據(jù)移動器的高度可擴展引擎陣列,基于FPGA和自適應SoC編譯算法專業(yè)知識而推出。其中,AI引擎可以讓AI和信號處理實現(xiàn)高性能和高能效,同樣FPGA架構也有類似優(yōu)勢。據(jù)透露,未來XDNA IP也將更多應用于Chiplet。首款基于AMD XDNA架構的Alveo V70加速卡已推出,主要針對 AI推理效率設計,可針對視頻分析及自然語言處理應用進行調整。
隨著大模型機遇逐漸從云端傳導至邊緣,AMD如何通過自適應計算滿足AI應用需求?
唐曉蕾表示,大模型從云開始驅動,但在對時延敏感的領域需要邊緣側的輕量級大模型。這些模型往往不需要幾億參數(shù),可能只需要關注幾個點進行訓練。由于使用場景多樣,邊緣側不太可能出現(xiàn)一款統(tǒng)一的ChatGPT,而是每個模型根據(jù)自身場景進行優(yōu)化。她認為,自適應計算更適合復雜應用場景,也將對邊緣AI的落地應用提供巨大助力。
當前,很多公司都在進行AI相關的應用研究,一些公司在進行AI項目前通常會使用FPGA做驗證,對復雜應用會選擇大型芯片,而對于簡單的應用則會選擇小芯片。但是在場景確定后,通常會選擇ASIC芯片。這對于FPGA的長遠應用是否帶來一定的壓力?
對此,唐曉蕾認為,當場景中的種種要素還未確定時,固化一個ASIC并不容易。對AMD來講,會堅持保留AIE(AI引擎)的特性,且目前看來,AIE是其所能提供的最優(yōu)解。這對用戶意味著,未來整體平臺不需要太大改動,便于他們在一致的平臺上形成經(jīng)驗積累,并且能夠快速實現(xiàn)想法、快速落地。
AMD官網(wǎng)顯示,他們目前主要提供兩種類型的AI引擎:AIE和AIE-ML(機器學習 AI 引擎)。與上一代 FPGA 相比,這兩種 AI 引擎的性能都得到了顯著提升。
其中,AIE可加速一組更加平衡的工作負載,包括ML推理應用和波束形成及雷達等高級信號處理工作負載,以及需要大量濾波和轉換的其它工作負載;AIE-ML通過增強的AI向量擴展以及在AI引擎陣列中引入共享內存塊。二者各有側重優(yōu)勢,在以ML推理為中心的應用中,AIE-ML性能更高;而在高級信號處理方面,AIE性能更高。這兩類AIE,便于為信號處理和機器學習的異構工作負載提供推理加速。
核心領域協(xié)同效應放大
AMD完成對賽靈思收購后,整體處理能力得到了進一步提升,在工業(yè)、視覺、醫(yī)療系統(tǒng)等高算力領域將產生更大的協(xié)同效應。
在工業(yè)智能制造領域,AMD通過數(shù)字孿生技術能夠讓工程快速精準落地,在智能倉儲應用場景,使物流解決方案更加高效。在工業(yè)機器人方面,AMD致力于讓自動化的流程更順暢、實現(xiàn)更精準的控制。
在產品驗證方面,正在從人眼驗證向機器驗證、智能視覺檢測轉型。這個過程涵蓋了非常多底層技術,AMD希望通過傳感、控制、計算與聯(lián)網(wǎng)等底層技術,讓數(shù)據(jù)更加有效地完成使命,推動中國制造走向中國智造。
醫(yī)療領域創(chuàng)新活躍的應用包括內窺鏡系統(tǒng)、醫(yī)療超聲、手術機器人、大型掃描儀器,以及病患護理等。AMD的可實時調節(jié)性以及靈活的計算處理,因此在內窺鏡分辨率方面有明顯的競爭優(yōu)勢;在醫(yī)療超聲方面,AMD落實可視化、智能化,以提升整體醫(yī)療系統(tǒng)效率,在信號的實時處理方面得到很大推廣。手術機器人方面,通過5G網(wǎng)絡和AI機器學習推理實現(xiàn)手術指導以更好地應用醫(yī)療資源;在CT、MR及大型掃描儀方面,AMD平臺支持圖象重構的卸載和加速處理,使得成像密度越來越高。
在工業(yè)、醫(yī)療、視覺等復雜應用場景,有著多樣化的應用需求,因此對自適應計算也有非常獨特的需求。AMD把SoC、FPGA組合在一起,能夠提供更高效的生產線,更快速地滿足客戶的資源配置需求。
唐曉蕾表示,“AMD在對賽靈思完成收購后非常重視協(xié)同效應,我們致力于發(fā)掘內部資源、客戶應用場景和銷售渠道等方面的協(xié)同效應。目前我們仍處于學習階段,對于協(xié)同效應的具體形式:比如是否引入Chiplet技術?是在產品層面協(xié)同、或者先從客戶應用開始協(xié)同?……這是整個公司共同努力的事,我們希望給客戶帶來1+1>2的效果。為了實現(xiàn)這一目標,我們需要與不同客戶共同協(xié)商制定方案并提供定制化服務,這也是我們‘同超越,共成就’的含義?!?/p>