作者|劉佳藝,編輯|白雪
新車發(fā)布會(huì)上,車企公布智駕行駛里程,已經(jīng)成為了智駕秀肌肉的基本操作。譬如 8 月份,鴻蒙智行公布了智駕里程達(dá)到 2 億公里。
車企之所以把智駕行駛里程拿到臺(tái)面上講,原因在于,這些真實(shí)的里程數(shù)據(jù),構(gòu)成了車企在智駕訓(xùn)練上的數(shù)字資產(chǎn),幫助車企在模型訓(xùn)練上不斷迭代升級(jí)。
這個(gè)過程發(fā)生在云端。
事實(shí)上,一個(gè)循環(huán)的數(shù)據(jù)流程在車端、云端之間 24 小時(shí)不間斷運(yùn)轉(zhuǎn)。即車端將數(shù)據(jù)反饋給云端,在云端集中進(jìn)行模型訓(xùn)練與仿真,再把模型數(shù)據(jù)發(fā)回車端形成閉環(huán),完成 OTA 部署及更新。
所以車企總喜歡把「開得越多,越好開」放在嘴邊,因?yàn)榈讓舆壿嬚沁@樣。這種「端到端」正是自動(dòng)駕駛大模型固有的訓(xùn)練方式。
不過,這和現(xiàn)在行業(yè)熱議的端到端自動(dòng)駕駛并不同,它指代的則是一種技術(shù)路徑,從輸入端到輸出端,從前被切分開的感知、預(yù)測、規(guī)劃、控制等任務(wù)模塊,貫穿成一個(gè)巨大的 AI 神經(jīng)網(wǎng)絡(luò),它能像人類大腦一樣快速作出決策。
有意思的是,這兩種「端到端」正碰撞到了一起,還對(duì)模型訓(xùn)練提出了更高要求:
-
- 采集、存儲(chǔ)百 PB 級(jí)別的數(shù)據(jù)量;
- 對(duì)高質(zhì)量數(shù)據(jù)實(shí)現(xiàn)高效率處理、訓(xùn)練;
- 完成從感知到規(guī)控一體的仿真測試;
- 保證數(shù)據(jù)全流程的合規(guī)安全;
- ……
顯然,這需要車企/智駕供應(yīng)商投入巨大的時(shí)間成本與人力成本,構(gòu)建出一套成熟、合規(guī)、穩(wěn)定的數(shù)據(jù)工具鏈,以此支撐 AI 模型高效地迭代升級(jí),模型的迭代效率越高,智駕產(chǎn)品落地速度越快,性能表現(xiàn)得越好。
對(duì)于車企/智駕供應(yīng)商而言,從零搭建地基,挑戰(zhàn)很大。
而以百度為代表的智能云服務(wù)商都看準(zhǔn)了這種為車企賦能的巨大機(jī)遇,在汽車云建設(shè)上打造了一整套數(shù)據(jù)工具鏈,貫穿數(shù)據(jù)采集、標(biāo)注、管理、仿真、測試等全流程,支持了業(yè)內(nèi)大批企業(yè)自動(dòng)駕駛服務(wù)的落地發(fā)展。
在最新一屆百度云智大會(huì)上,百度汽車云迭代到 3.0 版本,圍繞著端到端自動(dòng)駕駛的特性對(duì)工具鏈做了針對(duì)性優(yōu)化升級(jí),助力自動(dòng)駕駛玩家們打造高效運(yùn)轉(zhuǎn)的數(shù)據(jù)閉環(huán),攻克端到端自動(dòng)駕駛的落地難點(diǎn)。
01、用生成式AI 解開「數(shù)據(jù)劫」
端到端技術(shù)范式,是行業(yè)公認(rèn)通向高階自動(dòng)駕駛的最優(yōu)解。
這種與 AI 深度綁定的技術(shù)路徑,相當(dāng)于把摩天大樓繼續(xù)筑高,無疑給充當(dāng)?shù)鼗臄?shù)據(jù)工具鏈?zhǔn)┘恿烁髩毫Α?/p>
一方面,數(shù)據(jù)規(guī)模開始瘋狂擴(kuò)大,數(shù)據(jù)處理難度上升。
一個(gè)大致標(biāo)準(zhǔn)是:
實(shí)現(xiàn) L2、L3 級(jí)的自動(dòng)駕駛 Demo 模型,只需要百萬張圖片的數(shù)據(jù)量;
實(shí)現(xiàn) L2、L3 級(jí)自動(dòng)駕駛的量產(chǎn),需要億張圖片,數(shù)據(jù)量大于 100T;
實(shí)現(xiàn) L4 級(jí)的自動(dòng)駕駛 Demo 模型,存儲(chǔ)數(shù)據(jù)量從 T 級(jí)進(jìn)化為 P 級(jí);
最后,實(shí)現(xiàn) L4 級(jí)的自動(dòng)駕駛量產(chǎn),數(shù)據(jù)量已經(jīng)大于 50PB。
很明顯,每上升一個(gè)難度或?qū)蛹?jí)后,數(shù)據(jù)處理變得越來越難掌控。
如果把自動(dòng)駕駛數(shù)據(jù)處理鏈條攤開,可以看到這個(gè)流程包括篩選、清洗、標(biāo)注等重點(diǎn)環(huán)節(jié),這個(gè)步驟的關(guān)鍵目的是把真實(shí)數(shù)據(jù)變得有用。
端到端自動(dòng)駕駛對(duì)于「數(shù)據(jù)有用」的定義,是系統(tǒng)通過數(shù)據(jù)訓(xùn)練實(shí)現(xiàn)強(qiáng)大的泛化能力,能夠像老司機(jī)一樣,應(yīng)對(duì)各種復(fù)雜多變的駕駛場景,包括 Corner case(極端情況),如行人突然橫穿馬路、多路口環(huán)島路線、極限直角型轉(zhuǎn)彎等。
用一個(gè)比喻來講,就是訓(xùn)練出一個(gè)聰明大腦,它不僅會(huì)做大量的常規(guī)題目,面對(duì)沒有做過的難題時(shí),也能冷靜思考,合理分析,通過舉一反三的方式寫出正確解法。所以訓(xùn)練策略上需要注重廣度和深度,用來訓(xùn)練的數(shù)據(jù)要足夠豐富、多樣、具備挑戰(zhàn)性。
這就要求數(shù)據(jù)處理過程中,能從海量數(shù)據(jù)庫中快速挖掘、標(biāo)注這些高質(zhì)量的題型,構(gòu)成一個(gè)優(yōu)質(zhì)的訓(xùn)練集。
另一方面,仿真訓(xùn)練的邏輯發(fā)生變化,成為新的難題。
仿真訓(xùn)練相當(dāng)于自動(dòng)駕駛研發(fā)最后一道防線,驗(yàn)證評(píng)估。它好比一個(gè)專業(yè)的評(píng)價(jià)體系,給模型打分,分?jǐn)?shù)高的才能進(jìn)行到下面的車端部署環(huán)節(jié)上,分?jǐn)?shù)低的則要找到 bug 點(diǎn),回到訓(xùn)練模塊重新優(yōu)化。
目前,自動(dòng)駕駛的測評(píng)分為兩類,開環(huán)評(píng)估與閉環(huán)評(píng)估。
前者對(duì)于不同任務(wù)可以單拎出來,例如單獨(dú)評(píng)估感知、預(yù)測、規(guī)劃等環(huán)節(jié)的效果,與真實(shí)數(shù)據(jù)或標(biāo)注數(shù)據(jù)相比對(duì);
后者指在仿真引擎構(gòu)建的虛擬世界中建立反饋閉環(huán),從輸入到輸出端接受反饋信號(hào),與現(xiàn)在行業(yè)反復(fù)提及的「世界模型」一個(gè)概念。
端到端自動(dòng)駕駛由于感知、規(guī)劃這些環(huán)節(jié)都連成一體,意味著它只能走閉環(huán)評(píng)估的路線,這就要求,底層的數(shù)據(jù)工具鏈也能支持這種一體化的訓(xùn)練方式。
另外一層難度,體現(xiàn)在仿真訓(xùn)練更需要龐大的數(shù)據(jù)支撐,因?yàn)樗谋举|(zhì)是要建立一個(gè)虛擬世界,模擬車在真實(shí)世界中遭遇的一切,比如遇到水坑怎么過,前面迎面飄來塑料袋該做出什么反應(yīng),這需要包含許多長尾場景,并且場景要全面、真實(shí),因?yàn)樗悄P妥詈蟮脑u(píng)價(jià)體系,如果評(píng)價(jià)體系都不專業(yè),那整個(gè)模型訓(xùn)練都是一場無用功。
所以,針對(duì)這些層面上的升級(jí)要求,百度汽車云對(duì)數(shù)據(jù)工具鏈產(chǎn)品做了不同程度的升級(jí)完善,主要體現(xiàn)在兩點(diǎn)。
一是增加數(shù)據(jù)智搜功能,包括以文搜圖,以圖搜圖。
這可以幫助數(shù)據(jù)管理平臺(tái)快速完成數(shù)據(jù)篩選,精準(zhǔn)找到高質(zhì)量、有價(jià)值的數(shù)據(jù),比如需要一個(gè)公路上路面積水的場景,可以直接用一張圖、一句話描述,就能快速把相關(guān)數(shù)據(jù)鎖定、檢索出來,喂給 AI 模型做訓(xùn)練。
二是對(duì)采集數(shù)據(jù)進(jìn)行生成式動(dòng)作,用真實(shí)場景做仿真。
這可以實(shí)現(xiàn)對(duì)真實(shí)數(shù)據(jù)的再利用,正常情況下,一組高質(zhì)量的數(shù)據(jù)只能作為一次場景使用,但通過生成式 AI,把場景中某個(gè)障礙物抹除,再注入新的車輛,就能生成其他同樣真實(shí)的場景。
顯然,這是一種降本增效的有利解法,尤其對(duì)于場景匱乏,路測數(shù)據(jù)不足的企業(yè)而言,生成式 AI 在有限成本基礎(chǔ)上,讓采集數(shù)據(jù)在更多的泛化參數(shù)下,得到有效利用。
英偉達(dá)全球副總裁、汽車事業(yè)部負(fù)責(zé)人吳新宙認(rèn)為,隨著端到端大模型上車,AI 將以無限度的規(guī)則重新定義汽車。
某種程度上,生成式 AI 與自動(dòng)駕駛技術(shù)相結(jié)合,重塑智能化體驗(yàn),指向了高階自動(dòng)駕駛的落地實(shí)現(xiàn)。
所以,要在汽車智能化下半場提高勝率,則是要學(xué)會(huì)四個(gè)字,借力打力,抓住 AI 這一變革力量,這是百度智能云正在做的事。
另外需要強(qiáng)調(diào)的是,百度本身作為自動(dòng)駕駛的頭號(hào)玩家,十年的研究歷程下來,擁有真實(shí)、海量、豐富的數(shù)據(jù)資源,比如在百度地圖支持下,擁有上百個(gè)國內(nèi)主要城市全域數(shù)據(jù),測試?yán)锍谈采w千萬公里。這類豐富的數(shù)據(jù)資產(chǎn)對(duì)于建立仿真訓(xùn)練平臺(tái)有極大的優(yōu)勢。
02全鏈路訓(xùn)練優(yōu)化,把算力吃透
某智駕供應(yīng)商曾表示,數(shù)據(jù)會(huì)占據(jù)端到端自動(dòng)駕駛開發(fā)中 80% 以上的研發(fā)成本。
這其中也包含了算力,龐大的數(shù)據(jù)資產(chǎn)需要強(qiáng)大的算力資源支撐。
尤其是仿真平臺(tái),大量仿真任務(wù)并發(fā)運(yùn)行時(shí),CPU、GPU 任務(wù)混合在一起,這對(duì)算力資源造車不小壓力。
算力成為了自動(dòng)駕駛玩家們錨定的軍備競賽,這指向了兩種統(tǒng)一動(dòng)作。
一是興建智算中心。
以特斯拉為例,其消耗數(shù)十億美金興建超算中心,預(yù)計(jì)今年底算力最高將達(dá)到 100E FLOPS。
國內(nèi)智駕玩家顯然不具備這番資金實(shí)力,但在智算中心的算力投入上,一直不遺余力的提高上限。
二是打造世界模型。
端到端自動(dòng)駕駛對(duì)于「驗(yàn)證」的高要求,使得世界模型/仿真平臺(tái)成為智駕企業(yè)的加碼重點(diǎn)。
尤其是生成式 AI 出現(xiàn)后,這種模擬現(xiàn)實(shí)的強(qiáng)大工具被深度應(yīng)用在世界模型/仿真平臺(tái)的搭建中。
與之伴隨的,是對(duì)算力的高需求與高消耗。
據(jù)悉,端到端自動(dòng)駕駛的起步算力,大概在 1000P 左右。越往上走,算力要求越高,成本負(fù)荷越重。
與此同時(shí),還伴隨著一個(gè)難題,即算力效率低,如果算力冗余,沒有得到充分利用,那在算力上花費(fèi)的資金成本則又被砌高了。
所以關(guān)鍵是把有限算力發(fā)揮出最大價(jià)值,降低成本和時(shí)間,提高迭代速度。
百度智能云的算力服務(wù)優(yōu)勢由此凸顯出來,推出了百舸· AI 異構(gòu)計(jì)算平臺(tái) 4.0,提供了一套低成本、高效能的優(yōu)化方案。
這里值得一提的是,百舸平臺(tái)為了追求訓(xùn)練的極致性能,除了追求單卡本身的訓(xùn)練性能,也重視多卡之間的并行效率。
這種多芯訓(xùn)練,使得平臺(tái)能夠支持不同類型的芯片算力運(yùn)轉(zhuǎn),包括 A100、A800、國產(chǎn)芯片等,還能夠支持萬卡規(guī)模的大型集群,進(jìn)而幫助模型提升計(jì)算效率。
另外,百舸平臺(tái)這種端到端加速能力,對(duì)于不同的算法框架也做到了泛化性適配。
一個(gè)熱知識(shí)是,同一個(gè)算法模型在不同的訓(xùn)練框架上獲得的優(yōu)化能力不同,如果算法框架和模型的耦合能力差的話,還會(huì)造車算力資源使用差的負(fù)收益。
所以百舸平臺(tái)基于自動(dòng)調(diào)優(yōu)策略,通過并行優(yōu)化、顯存優(yōu)化,各種算子、存儲(chǔ)、網(wǎng)絡(luò)的各方面優(yōu)化行為,最大程度提高了訓(xùn)練效能。
可以通過一組數(shù)據(jù)論證:
在標(biāo)注場景下,百舸平臺(tái)的 GPU 共享方案將自動(dòng)化標(biāo)注的成本降低了 1 倍以上;
在模型訓(xùn)練場景下,百舸平臺(tái)幫助模型訓(xùn)練吞吐平均提升 138%,最高 400%,最多縮短 80% 的模型訓(xùn)練時(shí)間;
在仿真場景下,百舸平臺(tái)可以支持仿真平臺(tái)實(shí)現(xiàn)日行百萬公里的仿真里程。
一個(gè)真實(shí)案例是,某頭部車企通過百度智能云助力,模型訓(xùn)練性能提升了 170%,GPU 的資源效率提升了 2.5 倍。
顯然,百舸平臺(tái)作為強(qiáng)大的 AI 基礎(chǔ)設(shè)施,讓算力資源在多樣化場景下得到充分發(fā)揮,幫助智駕企業(yè)們抓住研發(fā)效率這個(gè)核心競爭力。
03云智一體,加速智能化終局
智能化的下半場,比拼的核心在于基礎(chǔ)設(shè)施——汽車云的能力,這決定水面之上性能的上限。
在這種云智一體的生態(tài)中,同樣能看到兩種趨勢正在生長。
一是車路云結(jié)合,把路測的數(shù)據(jù)引入進(jìn)來。
以往在路上開車,遇到交通事故、施工路段往往需要承受長達(dá)幾小時(shí)的堵塞折磨,這給出行帶來極大的不便利性。
而百度智能云和路測交通集團(tuán)合作,把數(shù)據(jù)聯(lián)通后。這些動(dòng)態(tài)的路況,以及天氣信息,都能早早通過 AI 提醒獲得,用戶可以提前根據(jù)信息規(guī)劃線路,保證出行的通暢。
比如,有車企就通過公交車的潮汐車道數(shù)據(jù)做路徑規(guī)劃,用戶可以巧妙避開堵塞路段,提升駕乘體驗(yàn)感。
值得一提的是,這種路況提醒,可以建立在不開啟導(dǎo)航地圖的基礎(chǔ)上,直接通過智能座艙實(shí)現(xiàn)。
這也指向了第二種趨勢,即智能座艙的體驗(yàn)感越來越好。
在 AI 大模型上車后,智能座艙從多模態(tài)的交互性演變成 AI 的主動(dòng)性越來越強(qiáng)。
也就是說,從用戶主動(dòng)發(fā)起問答式、指令式對(duì)話,AI 準(zhǔn)確理解并回答、執(zhí)行,變成 AI 主動(dòng)揣測用戶需求,在恰當(dāng)?shù)臅r(shí)機(jī)發(fā)起相關(guān)對(duì)話,推送對(duì)應(yīng)功能等。
另外,智能座艙的體驗(yàn)感也在逐步提升,比如極越 01、07 等車型上車了百度的座艙大模型后,能做到車外語音控制,通勤自動(dòng)導(dǎo)航等功能,并且還能通過「哨兵模式」,在車未啟動(dòng)時(shí),幫助用戶自動(dòng)記錄到車輛剮蹭等意外情況,并自動(dòng)啟動(dòng)行車記錄儀保留證據(jù)。
一個(gè)確定路徑是,伴隨著自動(dòng)駕駛、智能座艙向更高緯度的性能進(jìn)階,云服務(wù)商都在抓住這種為車企賦能的機(jī)遇,不斷推出具備競爭力的服務(wù)方案,在數(shù)據(jù)工具鏈的產(chǎn)力上內(nèi)卷。
小馬智行 CTO 樓天城在最新采訪中表示,數(shù)據(jù)鏈的成熟度,決定了最后模型好壞的關(guān)鍵。
而有能力把數(shù)據(jù)鏈做到支撐 L4 的一定是百度。事實(shí)上,百度本身就在 AI 領(lǐng)域長期積累,打造的 Apollo 平臺(tái)具備支撐 L2 至 L4 的量產(chǎn)落地實(shí)力。
而百度作為頭部自動(dòng)駕駛科技企業(yè),選擇以一種開放的心態(tài)來做云服務(wù),把核心工具鏈開放給行業(yè)使用。
根據(jù)全球領(lǐng)先的 IT 市場研究和咨詢公司 IDC 發(fā)布《中國人工智能公有云服務(wù)市場份額,2023》報(bào)告顯示,2023 年中國 AI 公有云服務(wù)市場整體規(guī)模達(dá) 126.1 億元人民幣,百度智能云市場份額以 26.4% 的成績排名第一。
值得一提的是,自 IDC 發(fā)布中國 AI 公有云市場報(bào)告以來,百度智能云已經(jīng)連續(xù) 5 年蟬聯(lián)中國市場第一。
在汽車行業(yè)集體擁抱智能化的今天,沒有一家車企能做到全棧自研,絕大多數(shù)都選擇與云服務(wù)商來個(gè)雙向奔赴,在強(qiáng)大的數(shù)字基建上構(gòu)建智能化壁壘,也正是在這種合作共贏的生態(tài)下,智能駕駛的想象力能夠進(jìn)一步延伸,并一步步轉(zhuǎn)變?yōu)楝F(xiàn)實(shí)。