眾所周知,自動駕駛技術將徹底改變傳統(tǒng)的交通和出行方式,甚至改變我們的生活。這個融合人工智能、大數(shù)據(jù)等多項關鍵技術的領域,已成為各國、各大科技巨頭、傳統(tǒng)車企以及初創(chuàng)企業(yè)競爭的新戰(zhàn)場,以求占領新技術高地,獲取更廣闊的發(fā)展空間。
3 月 19 日消息,阿里巴巴達摩院在自動駕駛領域再次取得了新突破。據(jù)了解,達摩院近期一篇論文入選計算機視覺頂會 CVPR 2020,該論文提出了一個通用、高性能的自動駕駛檢測器,首次實現(xiàn) 3D 物體檢測精度與速度的兼得,有效提升自動駕駛系統(tǒng)安全性能。目前,該檢測器在自動駕駛領域權威數(shù)據(jù)集 KITTI BEV 排行榜上排名第一。
?
達摩院位居榜單第一對于自動駕駛汽車系統(tǒng)來說,最基本且最具挑戰(zhàn)性的能力就是探測與分類對象。自動駕駛汽車必須能夠準確地評估周邊環(huán)境,才能根據(jù)車流、道路規(guī)則或者障礙物安全地調整行駛狀態(tài)。檢測器就是讓自動駕駛具備感知能力的核心組件,它可以快速處理、分析傳感器、激光雷達等采集的多維信息,讓車輛識別周圍環(huán)境的物體,并精準定位物體在三維空間中的位置,其檢測精度和速度均為自動駕駛系統(tǒng)安全性的重要指標。
目前,業(yè)界主流的檢測器尚無法兼顧“精度與速度”這兩個指標,極大地限制了自動駕駛的安全性能。而達摩院則這對這一點提出了全新的思路,找到了能二者兼得的方法。3D 目標檢測,指的是將使用 RGB 圖像、RGB-D 深度圖像和激光點云,輸出物體類別及在三維空間中的長寬高、旋轉角等信息的檢測。與僅從圖像平面估計 2D 邊界框的普通 2D 目標檢測不同,自動駕駛需要從現(xiàn)實世界估計更具信息量的 3D 邊界框,以完成諸如路徑規(guī)劃和避免碰撞之類的高級任務。而從點云數(shù)據(jù)進行 3D 目標檢測,則是自動駕駛系統(tǒng)中的的關鍵組件。
據(jù)了解,達摩院在模型訓練過程中,利用一個輔助網(wǎng)絡,將單階段檢測器中的體素特征轉化為點級特征,并輔以監(jiān)督信號,而模型推理過程中輔助網(wǎng)絡無需參與計算,最終實現(xiàn)速度和精度的兼得。測試結果顯示,達摩院檢測器在自動駕駛領域權威數(shù)據(jù)集 KITTI BEV 排行榜上排名第一,精度遠超其他的單階段檢測器,同時檢測速度達到 25FPS ,是目前排名第二方案的兩倍多。
?
檢測器的創(chuàng)新可以說是自動駕駛領域落地的關鍵突破口。而融合了單階段檢測器和兩階段檢測器優(yōu)勢的達摩院檢測器能夠快速識別周圍環(huán)境的物體,在保持精度的同時不增加額外的計算量,極大地推動了自動駕駛在安全行駛方面的發(fā)展。達摩院研究團隊表示:“檢測器是自動駕駛系統(tǒng)的核心組件之一,但該領域一直缺少創(chuàng)新和突破,此次我們實現(xiàn) 3D 檢測精讀和速度的提升,將有助于提高自動駕駛系統(tǒng)的安全性?!?/p>
目前,全球范圍內(nèi)大多數(shù)國家都已陸續(xù)推出自動駕駛法案或批準自動駕駛公共道路測試,荷蘭、美國加州和亞利桑那州更是允許無駕駛員陪同的自動駕駛汽車上路行駛。而由于中國國情、復雜的道路狀態(tài)、尚無法完全準確檢測路人等原因,國內(nèi)只開放了自動駕駛道路測試,仍然有一定的局限性。此次達摩院檢測器的研發(fā),或將進一步加速國內(nèi)自動駕駛的落地。
?
投入 1000 億,達摩院如何打造“AI 帝國”從阿里的戰(zhàn)略版圖來看,成立于 2017 年的阿里巴巴達摩院一直承載著阿里前沿技術中臺的角色,意在通過開展基礎科學和創(chuàng)新性技術研究,用科技解決未來的問題的同時,占領技術高地,裂變科技價值。馬云曾表示,“未來一定是技術帶來利潤,未來市場規(guī)模的取得靠創(chuàng)新?!痹诖嘶A上,在過去的這些年里,阿里為達摩院投入了 1000 億元,成立了語音實驗室、視覺實驗室、智能計算實驗室、自動駕駛實驗室、量子計算實驗室等。目前,各個實驗室都獲得了卓有成效的成果,其語言技術實驗室實現(xiàn)了 48 個語言翻譯方向、區(qū)塊鏈實驗室申請專利 500 余項專利、孵化出平頭哥半導體等公司 ...... 此外,達摩院旗下實驗室在國際頂級技術賽事上獲得了近 50 項世界第一,入選 500 多篇國際頂會論文,在業(yè)內(nèi)享有盛譽。
?
現(xiàn)在,在“新基建”的推動下,3 月 10 日,達摩院成立了第 15 個實驗室——XG 實驗室,主要聚焦 5G 技術和應用的協(xié)同研發(fā),為超高清視頻、在線辦公、AR/VR、工業(yè)互聯(lián)網(wǎng)、智能物流、自動駕駛等場景研究符合 5G 時代的視頻編解碼技術、網(wǎng)絡傳輸協(xié)議等,并制定相關標準。同時,從“新基建”中衍生出的細分產(chǎn)業(yè)鏈來看,達摩院下的實驗室皆在“新基建”的發(fā)展板塊里,且聚焦大數(shù)據(jù)、人工智能等領域的底層技術,其具有的戰(zhàn)略意義顯而易見。而其在應用、制定相關標準等方向的動作也讓阿里的“野心”顯露無疑,即全面掌握 AI 核心技術的話語權。
如今,海量用戶場景、開源技術生態(tài)、大規(guī)模研發(fā)投入和頂級人才團隊以及自身的 AI 商業(yè)模式的構建,已成為阿里 AI 取得現(xiàn)有成績的關鍵。同時,應用是衡量 AI 領域商業(yè)化價值的重要標準,而阿里產(chǎn)業(yè) AI 目前已遍及醫(yī)療、金融、制造、司法、交通、環(huán)保、教育、零售等領域,其優(yōu)勢也是不言而喻從數(shù)據(jù)到生態(tài),從技術到應用,阿里將打造出“AI 帝國”的新壁壘。