囯产精品一区二区三区线,日韩精品全裸高清在线观看视频

作者｜劉佳藝，編輯｜白雪

新車發(fā)布會(huì)上，車企公布智駕行駛里程，已經(jīng)成為了智駕秀肌肉的基本操作。譬如 8 月份，鴻蒙智行公布了智駕里程達(dá)到 2 億公里。

車企之所以把智駕行駛里程拿到臺(tái)面上講，原因在于，這些真實(shí)的里程數(shù)據(jù)，構(gòu)成了車企在智駕訓(xùn)練上的數(shù)字資產(chǎn)，幫助車企在模型訓(xùn)練上不斷迭代升級(jí)。

這個(gè)過程發(fā)生在云端。

事實(shí)上，一個(gè)循環(huán)的數(shù)據(jù)流程在車端、云端之間 24 小時(shí)不間斷運(yùn)轉(zhuǎn)。即車端將數(shù)據(jù)反饋給云端，在云端集中進(jìn)行模型訓(xùn)練與仿真，再把模型數(shù)據(jù)發(fā)回車端形成閉環(huán)，完成 OTA 部署及更新。

所以車企總喜歡把「開得越多，越好開」放在嘴邊，因?yàn)榈讓舆壿嬚沁@樣。這種「端到端」正是自動(dòng)駕駛大模型固有的訓(xùn)練方式。

不過，這和現(xiàn)在行業(yè)熱議的端到端自動(dòng)駕駛并不同，它指代的則是一種技術(shù)路徑，從輸入端到輸出端，從前被切分開的感知、預(yù)測、規(guī)劃、控制等任務(wù)模塊，貫穿成一個(gè)巨大的 AI 神經(jīng)網(wǎng)絡(luò)，它能像人類大腦一樣快速作出決策。

有意思的是，這兩種「端到端」正碰撞到了一起，還對(duì)模型訓(xùn)練提出了更高要求：

- 采集、存儲(chǔ)百 PB 級(jí)別的數(shù)據(jù)量；
- 對(duì)高質(zhì)量數(shù)據(jù)實(shí)現(xiàn)高效率處理、訓(xùn)練；
- 完成從感知到規(guī)控一體的仿真測試；
- 保證數(shù)據(jù)全流程的合規(guī)安全；
- ……

顯然，這需要車企/智駕供應(yīng)商投入巨大的時(shí)間成本與人力成本，構(gòu)建出一套成熟、合規(guī)、穩(wěn)定的數(shù)據(jù)工具鏈，以此支撐 AI 模型高效地迭代升級(jí)，模型的迭代效率越高，智駕產(chǎn)品落地速度越快，性能表現(xiàn)得越好。

對(duì)于車企/智駕供應(yīng)商而言，從零搭建地基，挑戰(zhàn)很大。

而以百度為代表的智能云服務(wù)商都看準(zhǔn)了這種為車企賦能的巨大機(jī)遇，在汽車云建設(shè)上打造了一整套數(shù)據(jù)工具鏈，貫穿數(shù)據(jù)采集、標(biāo)注、管理、仿真、測試等全流程，支持了業(yè)內(nèi)大批企業(yè)自動(dòng)駕駛服務(wù)的落地發(fā)展。

在最新一屆百度云智大會(huì)上，百度汽車云迭代到 3.0 版本，圍繞著端到端自動(dòng)駕駛的特性對(duì)工具鏈做了針對(duì)性優(yōu)化升級(jí)，助力自動(dòng)駕駛玩家們打造高效運(yùn)轉(zhuǎn)的數(shù)據(jù)閉環(huán)，攻克端到端自動(dòng)駕駛的落地難點(diǎn)。

01、用生成式AI 解開「數(shù)據(jù)劫」

端到端技術(shù)范式，是行業(yè)公認(rèn)通向高階自動(dòng)駕駛的最優(yōu)解。

這種與 AI 深度綁定的技術(shù)路徑，相當(dāng)于把摩天大樓繼續(xù)筑高，無疑給充當(dāng)?shù)鼗臄?shù)據(jù)工具鏈?zhǔn)┘恿烁髩毫Α?/p>

一方面，數(shù)據(jù)規(guī)模開始瘋狂擴(kuò)大，數(shù)據(jù)處理難度上升。

一個(gè)大致標(biāo)準(zhǔn)是：

實(shí)現(xiàn) L2、L3 級(jí)的自動(dòng)駕駛 Demo 模型，只需要百萬張圖片的數(shù)據(jù)量；

實(shí)現(xiàn) L2、L3 級(jí)自動(dòng)駕駛的量產(chǎn)，需要億張圖片，數(shù)據(jù)量大于 100T；

實(shí)現(xiàn) L4 級(jí)的自動(dòng)駕駛 Demo 模型，存儲(chǔ)數(shù)據(jù)量從 T 級(jí)進(jìn)化為 P 級(jí)；

最后，實(shí)現(xiàn) L4 級(jí)的自動(dòng)駕駛量產(chǎn)，數(shù)據(jù)量已經(jīng)大于 50PB。

很明顯，每上升一個(gè)難度或?qū)蛹?jí)后，數(shù)據(jù)處理變得越來越難掌控。

如果把自動(dòng)駕駛數(shù)據(jù)處理鏈條攤開，可以看到這個(gè)流程包括篩選、清洗、標(biāo)注等重點(diǎn)環(huán)節(jié)，這個(gè)步驟的關(guān)鍵目的是把真實(shí)數(shù)據(jù)變得有用。

端到端自動(dòng)駕駛對(duì)于「數(shù)據(jù)有用」的定義，是系統(tǒng)通過數(shù)據(jù)訓(xùn)練實(shí)現(xiàn)強(qiáng)大的泛化能力，能夠像老司機(jī)一樣，應(yīng)對(duì)各種復(fù)雜多變的駕駛場景，包括 Corner case（極端情況），如行人突然橫穿馬路、多路口環(huán)島路線、極限直角型轉(zhuǎn)彎等。

用一個(gè)比喻來講，就是訓(xùn)練出一個(gè)聰明大腦，它不僅會(huì)做大量的常規(guī)題目，面對(duì)沒有做過的難題時(shí)，也能冷靜思考，合理分析，通過舉一反三的方式寫出正確解法。所以訓(xùn)練策略上需要注重廣度和深度，用來訓(xùn)練的數(shù)據(jù)要足夠豐富、多樣、具備挑戰(zhàn)性。

這就要求數(shù)據(jù)處理過程中，能從海量數(shù)據(jù)庫中快速挖掘、標(biāo)注這些高質(zhì)量的題型，構(gòu)成一個(gè)優(yōu)質(zhì)的訓(xùn)練集。

另一方面，仿真訓(xùn)練的邏輯發(fā)生變化，成為新的難題。

仿真訓(xùn)練相當(dāng)于自動(dòng)駕駛研發(fā)最后一道防線，驗(yàn)證評(píng)估。它好比一個(gè)專業(yè)的評(píng)價(jià)體系，給模型打分，分?jǐn)?shù)高的才能進(jìn)行到下面的車端部署環(huán)節(jié)上，分?jǐn)?shù)低的則要找到 bug 點(diǎn)，回到訓(xùn)練模塊重新優(yōu)化。

目前，自動(dòng)駕駛的測評(píng)分為兩類，開環(huán)評(píng)估與閉環(huán)評(píng)估。

前者對(duì)于不同任務(wù)可以單拎出來，例如單獨(dú)評(píng)估感知、預(yù)測、規(guī)劃等環(huán)節(jié)的效果，與真實(shí)數(shù)據(jù)或標(biāo)注數(shù)據(jù)相比對(duì)；

后者指在仿真引擎構(gòu)建的虛擬世界中建立反饋閉環(huán)，從輸入到輸出端接受反饋信號(hào)，與現(xiàn)在行業(yè)反復(fù)提及的「世界模型」一個(gè)概念。

端到端自動(dòng)駕駛由于感知、規(guī)劃這些環(huán)節(jié)都連成一體，意味著它只能走閉環(huán)評(píng)估的路線，這就要求，底層的數(shù)據(jù)工具鏈也能支持這種一體化的訓(xùn)練方式。

另外一層難度，體現(xiàn)在仿真訓(xùn)練更需要龐大的數(shù)據(jù)支撐，因?yàn)樗谋举|(zhì)是要建立一個(gè)虛擬世界，模擬車在真實(shí)世界中遭遇的一切，比如遇到水坑怎么過，前面迎面飄來塑料袋該做出什么反應(yīng)，這需要包含許多長尾場景，并且場景要全面、真實(shí)，因?yàn)樗悄Ｐ妥詈蟮脑u(píng)價(jià)體系，如果評(píng)價(jià)體系都不專業(yè)，那整個(gè)模型訓(xùn)練都是一場無用功。

所以，針對(duì)這些層面上的升級(jí)要求，百度汽車云對(duì)數(shù)據(jù)工具鏈產(chǎn)品做了不同程度的升級(jí)完善，主要體現(xiàn)在兩點(diǎn)。

一是增加數(shù)據(jù)智搜功能，包括以文搜圖，以圖搜圖。

這可以幫助數(shù)據(jù)管理平臺(tái)快速完成數(shù)據(jù)篩選，精準(zhǔn)找到高質(zhì)量、有價(jià)值的數(shù)據(jù)，比如需要一個(gè)公路上路面積水的場景，可以直接用一張圖、一句話描述，就能快速把相關(guān)數(shù)據(jù)鎖定、檢索出來，喂給 AI 模型做訓(xùn)練。

二是對(duì)采集數(shù)據(jù)進(jìn)行生成式動(dòng)作，用真實(shí)場景做仿真。

這可以實(shí)現(xiàn)對(duì)真實(shí)數(shù)據(jù)的再利用，正常情況下，一組高質(zhì)量的數(shù)據(jù)只能作為一次場景使用，但通過生成式 AI，把場景中某個(gè)障礙物抹除，再注入新的車輛，就能生成其他同樣真實(shí)的場景。

顯然，這是一種降本增效的有利解法，尤其對(duì)于場景匱乏，路測數(shù)據(jù)不足的企業(yè)而言，生成式 AI 在有限成本基礎(chǔ)上，讓采集數(shù)據(jù)在更多的泛化參數(shù)下，得到有效利用。

英偉達(dá)全球副總裁、汽車事業(yè)部負(fù)責(zé)人吳新宙認(rèn)為，隨著端到端大模型上車，AI 將以無限度的規(guī)則重新定義汽車。

某種程度上，生成式 AI 與自動(dòng)駕駛技術(shù)相結(jié)合，重塑智能化體驗(yàn)，指向了高階自動(dòng)駕駛的落地實(shí)現(xiàn)。

所以，要在汽車智能化下半場提高勝率，則是要學(xué)會(huì)四個(gè)字，借力打力，抓住 AI 這一變革力量，這是百度智能云正在做的事。

另外需要強(qiáng)調(diào)的是，百度本身作為自動(dòng)駕駛的頭號(hào)玩家，十年的研究歷程下來，擁有真實(shí)、海量、豐富的數(shù)據(jù)資源，比如在百度地圖支持下，擁有上百個(gè)國內(nèi)主要城市全域數(shù)據(jù)，測試?yán)锍谈采w千萬公里。這類豐富的數(shù)據(jù)資產(chǎn)對(duì)于建立仿真訓(xùn)練平臺(tái)有極大的優(yōu)勢。

02全鏈路訓(xùn)練優(yōu)化，把算力吃透

某智駕供應(yīng)商曾表示，數(shù)據(jù)會(huì)占據(jù)端到端自動(dòng)駕駛開發(fā)中 80% 以上的研發(fā)成本。

這其中也包含了算力，龐大的數(shù)據(jù)資產(chǎn)需要強(qiáng)大的算力資源支撐。

尤其是仿真平臺(tái)，大量仿真任務(wù)并發(fā)運(yùn)行時(shí)，CPU、GPU 任務(wù)混合在一起，這對(duì)算力資源造車不小壓力。

算力成為了自動(dòng)駕駛玩家們錨定的軍備競賽，這指向了兩種統(tǒng)一動(dòng)作。

一是興建智算中心。

以特斯拉為例，其消耗數(shù)十億美金興建超算中心，預(yù)計(jì)今年底算力最高將達(dá)到 100E FLOPS。

國內(nèi)智駕玩家顯然不具備這番資金實(shí)力，但在智算中心的算力投入上，一直不遺余力的提高上限。

二是打造世界模型。

端到端自動(dòng)駕駛對(duì)于「驗(yàn)證」的高要求，使得世界模型/仿真平臺(tái)成為智駕企業(yè)的加碼重點(diǎn)。

尤其是生成式 AI 出現(xiàn)后，這種模擬現(xiàn)實(shí)的強(qiáng)大工具被深度應(yīng)用在世界模型/仿真平臺(tái)的搭建中。

與之伴隨的，是對(duì)算力的高需求與高消耗。

據(jù)悉，端到端自動(dòng)駕駛的起步算力，大概在 1000P 左右。越往上走，算力要求越高，成本負(fù)荷越重。

與此同時(shí)，還伴隨著一個(gè)難題，即算力效率低，如果算力冗余，沒有得到充分利用，那在算力上花費(fèi)的資金成本則又被砌高了。

所以關(guān)鍵是把有限算力發(fā)揮出最大價(jià)值，降低成本和時(shí)間，提高迭代速度。

百度智能云的算力服務(wù)優(yōu)勢由此凸顯出來，推出了百舸· AI 異構(gòu)計(jì)算平臺(tái) 4.0，提供了一套低成本、高效能的優(yōu)化方案。

這里值得一提的是，百舸平臺(tái)為了追求訓(xùn)練的極致性能，除了追求單卡本身的訓(xùn)練性能，也重視多卡之間的并行效率。

這種多芯訓(xùn)練，使得平臺(tái)能夠支持不同類型的芯片算力運(yùn)轉(zhuǎn)，包括 A100、A800、國產(chǎn)芯片等，還能夠支持萬卡規(guī)模的大型集群，進(jìn)而幫助模型提升計(jì)算效率。

另外，百舸平臺(tái)這種端到端加速能力，對(duì)于不同的算法框架也做到了泛化性適配。

一個(gè)熱知識(shí)是，同一個(gè)算法模型在不同的訓(xùn)練框架上獲得的優(yōu)化能力不同，如果算法框架和模型的耦合能力差的話，還會(huì)造車算力資源使用差的負(fù)收益。

所以百舸平臺(tái)基于自動(dòng)調(diào)優(yōu)策略，通過并行優(yōu)化、顯存優(yōu)化，各種算子、存儲(chǔ)、網(wǎng)絡(luò)的各方面優(yōu)化行為，最大程度提高了訓(xùn)練效能。

可以通過一組數(shù)據(jù)論證：

在標(biāo)注場景下，百舸平臺(tái)的 GPU 共享方案將自動(dòng)化標(biāo)注的成本降低了 1 倍以上；

在模型訓(xùn)練場景下，百舸平臺(tái)幫助模型訓(xùn)練吞吐平均提升 138%，最高 400%，最多縮短 80% 的模型訓(xùn)練時(shí)間；

在仿真場景下，百舸平臺(tái)可以支持仿真平臺(tái)實(shí)現(xiàn)日行百萬公里的仿真里程。

一個(gè)真實(shí)案例是，某頭部車企通過百度智能云助力，模型訓(xùn)練性能提升了 170%，GPU 的資源效率提升了 2.5 倍。

顯然，百舸平臺(tái)作為強(qiáng)大的 AI 基礎(chǔ)設(shè)施，讓算力資源在多樣化場景下得到充分發(fā)揮，幫助智駕企業(yè)們抓住研發(fā)效率這個(gè)核心競爭力。

03云智一體，加速智能化終局

智能化的下半場，比拼的核心在于基礎(chǔ)設(shè)施——汽車云的能力，這決定水面之上性能的上限。

在這種云智一體的生態(tài)中，同樣能看到兩種趨勢正在生長。

一是車路云結(jié)合，把路測的數(shù)據(jù)引入進(jìn)來。

以往在路上開車，遇到交通事故、施工路段往往需要承受長達(dá)幾小時(shí)的堵塞折磨，這給出行帶來極大的不便利性。

而百度智能云和路測交通集團(tuán)合作，把數(shù)據(jù)聯(lián)通后。這些動(dòng)態(tài)的路況，以及天氣信息，都能早早通過 AI 提醒獲得，用戶可以提前根據(jù)信息規(guī)劃線路，保證出行的通暢。

比如，有車企就通過公交車的潮汐車道數(shù)據(jù)做路徑規(guī)劃，用戶可以巧妙避開堵塞路段，提升駕乘體驗(yàn)感。

值得一提的是，這種路況提醒，可以建立在不開啟導(dǎo)航地圖的基礎(chǔ)上，直接通過智能座艙實(shí)現(xiàn)。

這也指向了第二種趨勢，即智能座艙的體驗(yàn)感越來越好。

在 AI 大模型上車后，智能座艙從多模態(tài)的交互性演變成 AI 的主動(dòng)性越來越強(qiáng)。

也就是說，從用戶主動(dòng)發(fā)起問答式、指令式對(duì)話，AI 準(zhǔn)確理解并回答、執(zhí)行，變成 AI 主動(dòng)揣測用戶需求，在恰當(dāng)?shù)臅r(shí)機(jī)發(fā)起相關(guān)對(duì)話，推送對(duì)應(yīng)功能等。

另外，智能座艙的體驗(yàn)感也在逐步提升，比如極越 01、07 等車型上車了百度的座艙大模型后，能做到車外語音控制，通勤自動(dòng)導(dǎo)航等功能，并且還能通過「哨兵模式」，在車未啟動(dòng)時(shí)，幫助用戶自動(dòng)記錄到車輛剮蹭等意外情況，并自動(dòng)啟動(dòng)行車記錄儀保留證據(jù)。

一個(gè)確定路徑是，伴隨著自動(dòng)駕駛、智能座艙向更高緯度的性能進(jìn)階，云服務(wù)商都在抓住這種為車企賦能的機(jī)遇，不斷推出具備競爭力的服務(wù)方案，在數(shù)據(jù)工具鏈的產(chǎn)力上內(nèi)卷。

小馬智行 CTO 樓天城在最新采訪中表示，數(shù)據(jù)鏈的成熟度，決定了最后模型好壞的關(guān)鍵。

而有能力把數(shù)據(jù)鏈做到支撐 L4 的一定是百度。事實(shí)上，百度本身就在 AI 領(lǐng)域長期積累，打造的 Apollo 平臺(tái)具備支撐 L2 至 L4 的量產(chǎn)落地實(shí)力。

而百度作為頭部自動(dòng)駕駛科技企業(yè)，選擇以一種開放的心態(tài)來做云服務(wù)，把核心工具鏈開放給行業(yè)使用。

根據(jù)全球領(lǐng)先的 IT 市場研究和咨詢公司 IDC 發(fā)布《中國人工智能公有云服務(wù)市場份額，2023》報(bào)告顯示，2023 年中國 AI 公有云服務(wù)市場整體規(guī)模達(dá) 126.1 億元人民幣，百度智能云市場份額以 26.4% 的成績排名第一。

值得一提的是，自 IDC 發(fā)布中國 AI 公有云市場報(bào)告以來，百度智能云已經(jīng)連續(xù) 5 年蟬聯(lián)中國市場第一。

在汽車行業(yè)集體擁抱智能化的今天，沒有一家車企能做到全棧自研，絕大多數(shù)都選擇與云服務(wù)商來個(gè)雙向奔赴，在強(qiáng)大的數(shù)字基建上構(gòu)建智能化壁壘，也正是在這種合作共贏的生態(tài)下，智能駕駛的想象力能夠進(jìn)一步延伸，并一步步轉(zhuǎn)變?yōu)楝F(xiàn)實(shí)。