曹原 發(fā)自 副駕寺,智能車參考 | 公眾號 AI4Auto
特斯拉FSD V12系統(tǒng)的開發(fā)細(xì)節(jié)曝光了。
雖然馬斯克預(yù)告過FSD V12改變了技術(shù)路線,但讓人意外的是,特斯拉其實在今年年初才開始訓(xùn)練這個基于神經(jīng)網(wǎng)絡(luò)的智能駕駛算法。
而就在四個月后,新系統(tǒng)就已經(jīng)準(zhǔn)備好取代舊系統(tǒng);八個月后,全新的FSD V12在馬斯克直播中亮相。
這背后則是一條改變的技術(shù)路線,從規(guī)則驅(qū)動,到數(shù)據(jù)驅(qū)動;從分模塊設(shè)計,到端到端。
同時也帶來了新挑戰(zhàn)。
FSD V12:只有神經(jīng)網(wǎng)絡(luò)
總的來說,特斯拉FSD V12只有一個核心特點:沒有規(guī)則代碼,只有神經(jīng)網(wǎng)絡(luò)。
什么意思?
市面上常見的自動駕駛系統(tǒng),大多采用分模塊設(shè)計,包括感知、決策、控制三個模塊,各任務(wù)內(nèi)部采用各自的算法模型。
其中AI算法主要應(yīng)用在感知模塊,決策、控制模塊還是常規(guī)的,基于if else邏輯的代碼。
也就是算法工程師編寫的代碼,會給自動駕駛系統(tǒng)建立一套規(guī)則,紅燈時要停車、綠燈時可以通行、要在車道中間行駛等等。
所以這種系統(tǒng)缺點很明顯,規(guī)則設(shè)定標(biāo)準(zhǔn)由各家工程師確定,駕駛風(fēng)格很容易和司機習(xí)慣不匹配,從而體驗很差,還不如自己開。
而特斯拉FSD V12只有神經(jīng)網(wǎng)絡(luò)的意思是,以往感知、決策、控制的幾大模塊在設(shè)計時統(tǒng)統(tǒng)不需要,只要確定神經(jīng)網(wǎng)絡(luò)架構(gòu),然后輸入數(shù)據(jù)訓(xùn)練就行。
一套神經(jīng)網(wǎng)絡(luò)能處理所有輸入信號,并且輸出駕駛決策。
根據(jù)真實的人類駕駛數(shù)據(jù),系統(tǒng)就能學(xué)會怎么開車,并不斷開得更好。
這也就是所謂的從規(guī)則驅(qū)動到數(shù)據(jù)驅(qū)動。
從根據(jù)輸入的各種環(huán)境信息,系統(tǒng)基于規(guī)則來判斷這種情況下要怎么開;到訓(xùn)練時先輸入人類駕駛數(shù)據(jù),系統(tǒng)充分學(xué)習(xí)人類駕駛習(xí)慣后,在實際駕駛環(huán)境中根據(jù)輸入的環(huán)境信息自己判斷怎么開。
如果有處理得不好的情況,就專門針對這個場景多輸入一些數(shù)據(jù)。
也就是類似ChatGPT的訓(xùn)練方式,不過是更適用于汽車的版本。
在決定改變技術(shù)路線之前,特斯拉自動駕駛團隊就向馬斯克展示了基于神經(jīng)網(wǎng)絡(luò)的系統(tǒng)能處理更好的情況。
在道路上散落著垃圾桶、倒下的交通錐,還有一些隨機障礙物時,汽車能準(zhǔn)確繞過以上障礙物,穿過車道線,并在必要的時候違反一些交通規(guī)則。
而在直播之前,馬斯克也對基于神經(jīng)網(wǎng)絡(luò)開發(fā)的FSD進行了一次測試。
共計25分鐘的行駛路程,馬斯克只在系統(tǒng)處理過于謹(jǐn)慎時踩了踩油門,但始終沒有碰過方向盤,中間還有一次系統(tǒng)做出了比他預(yù)想中更好的操作。
我的人類神經(jīng)網(wǎng)絡(luò)在這里失敗了。
如何看待
其實早在馬斯克宣布FSD V12變?yōu)槎说蕉思夹g(shù)路線之前,這個概念已經(jīng)在自動駕駛玩家內(nèi)興起。
因為端到端自動駕駛系統(tǒng)開發(fā)難度低,不用前期寫海量代碼(FSD V11版本控制堆棧中有超過30萬行C++代碼),也不用工程師提前設(shè)計規(guī)則。
只需要不斷輸入人類駕駛數(shù)據(jù),系統(tǒng)就能自己看著學(xué)。
但是這對于自動駕駛玩家也提出了很高的要求。
比如輸入的必須是大量優(yōu)質(zhì)數(shù)據(jù),才能更好幫助系統(tǒng)學(xué)習(xí)。
馬斯克發(fā)現(xiàn),當(dāng)輸入超過100萬個視頻后,基于神經(jīng)網(wǎng)絡(luò)的自動駕駛系統(tǒng)才開始表現(xiàn)良好。
而在今年年初,特斯拉就已經(jīng)向這套系統(tǒng)里輸入了1000萬個人類駕駛視頻,并且還是經(jīng)過篩選的,老司機的那種。
特斯拉在全球各地近200萬輛的車隊,每天也會提供約1600億幀視頻用于訓(xùn)練。特斯拉預(yù)計,未來用于訓(xùn)練的視頻將達(dá)到數(shù)十億幀。
這對于數(shù)據(jù)量、數(shù)據(jù)標(biāo)注、算力等等來說都是挑戰(zhàn)。
并且,端到端技術(shù)之所以沒有大規(guī)模在自動駕駛玩家內(nèi)普及,是因為有一個關(guān)鍵問題:這會增加自動駕駛系統(tǒng)的不可解釋性。
現(xiàn)階段來說,端到端自動駕駛?cè)匀皇且粋€“黑盒”,沒有辦法精準(zhǔn)解釋某情況下系統(tǒng)處理得不好是因為什么。
所以特斯拉給出的解決方案是,在測試時發(fā)現(xiàn)系統(tǒng)處理得不好,那就針對性的多喂數(shù)據(jù)。
比如馬斯克直播時系統(tǒng)差點闖紅燈,給出的解決方案就是多輸入一些交通信號燈,特別是左轉(zhuǎn)信號燈的視頻。
另外,馬斯克也給團隊定下了一個指標(biāo),實時顯示FSD系統(tǒng)在沒有人類干預(yù)的情況下行使的英里數(shù)。如果出現(xiàn)干預(yù)情況,就處理對應(yīng)的問題。
更重要的是,這樣學(xué)下去還會誕生一個新的問題:系統(tǒng)不僅會學(xué)到老司機的絲滑操作,也會學(xué)到人類司機沒有符合交通規(guī)則的行為。
比如在遇到停車標(biāo)志時,超過95%的人會緩慢通過,而不是完全停車。
這意味著監(jiān)管部門需要明確規(guī)范標(biāo)準(zhǔn)。
美國國家公路安全委員會就正在研究,是否允許自動駕駛系統(tǒng)進行沒有完全遵守交規(guī)的操作。
總之,特斯拉FSD V12的面世對于自動駕駛來說確實意義重大。既然能實現(xiàn)全流程AI化,那么就更有邁向AGI,即通用人工智能的可能。
自動駕駛何時能迎來ChatGPT時刻?
命運的齒輪或許就從此刻開始轉(zhuǎn)動。
參考鏈接:
https://www.cnbc.com/2023/09/09/ai-for-cars-walter-isaacson-biography-of-elon-musk-excerpt.html