雷剛 發(fā)自 副駕寺
量子位 | 公眾號(hào) QbitAI
不爭(zhēng)了。輔助駕駛是通向自動(dòng)駕駛的必由之路,漸進(jìn)式路線更快贏得終局。
在創(chuàng)辦的第1020天,在第六個(gè)HAOMO AI DAY現(xiàn)場(chǎng),這種態(tài)度被亮得明確,結(jié)論講得擲地有聲。此時(shí)此地此身,在實(shí)踐成果和趨勢(shì)再清晰不過(guò)的情況下,多年的自動(dòng)駕駛路線之爭(zhēng),已再無(wú)爭(zhēng)論的必要。
特斯拉開(kāi)創(chuàng)的路線,國(guó)外以FSD公測(cè)開(kāi)始上路,國(guó)內(nèi)則被速度更快的面壁者推向了檢驗(yàn)時(shí)刻,而且是一個(gè)更大的數(shù)據(jù)閉環(huán)模型啟動(dòng)時(shí)刻。
這個(gè)在中國(guó)直道超車的面壁者就是毫末智行,現(xiàn)在還旗幟鮮明把行業(yè)公理真諦打上公屏:遵循數(shù)據(jù)智能,依靠數(shù)據(jù)智能,實(shí)踐數(shù)據(jù)智能,這是驅(qū)動(dòng)自動(dòng)駕駛駛?cè)虢K局的第一性原理。
并且隨著自動(dòng)駕駛相關(guān)的軟硬件進(jìn)入量產(chǎn)期,行業(yè)的探索來(lái)到了規(guī)模化進(jìn)城時(shí)刻——新的分水嶺,同樣再清晰不過(guò)。
整個(gè)自動(dòng)駕駛,將進(jìn)入以數(shù)據(jù)智能驅(qū)動(dòng)的3.0時(shí)代。
大道至簡(jiǎn),方法論清晰,自動(dòng)駕駛已無(wú)壁可面。
實(shí)踐成果是展現(xiàn)真理的唯一標(biāo)準(zhǔn)
毫末智行的面壁成果是通過(guò)實(shí)踐成績(jī)展現(xiàn)的。自創(chuàng)辦以來(lái),毫末智行剛度過(guò)了第1000天,卻已經(jīng)快速坐穩(wěn)了中國(guó)量產(chǎn)自動(dòng)駕駛第一名。
量產(chǎn)自動(dòng)駕駛,對(duì)應(yīng)的是無(wú)人駕駛,指的是把自動(dòng)駕駛能力應(yīng)用于量產(chǎn)車落地的實(shí)踐。
在乘用車領(lǐng)域,毫末智行在短短2年多的時(shí)間內(nèi),從無(wú)到有推出了三代乘用車輔助駕駛產(chǎn)品HPilot,兩年6次OTA升級(jí),實(shí)現(xiàn)搭載超過(guò)十款乘用車型量產(chǎn)落地,同時(shí)并行30個(gè)項(xiàng)目異步開(kāi)發(fā)。
包括魏牌摩卡、魏牌拿鐵、魏牌瑪奇朵、坦克300、坦克500、哈弗神獸、拿鐵DHT-PHEV等在內(nèi)的上市車型,均已完成上車搭載。此外摩卡DHT-PHEV激光雷達(dá)版、歐拉閃電貓、歐拉芭蕾貓、全新一代長(zhǎng)城炮等則正在陸續(xù)交付。
于是截至2022年9月,毫末用戶輔助駕駛行駛里程突破1700萬(wàn)公里,在中國(guó)量產(chǎn)自動(dòng)駕駛陣營(yíng)坐穩(wěn)第一名。
并且這只是規(guī)模化落地的開(kāi)始,毫末智行方面稱,到2022年底,HPilot預(yù)計(jì)搭載車型近30款,未來(lái)搭載車型達(dá)到百萬(wàn)量級(jí)。
同時(shí)自動(dòng)駕駛歷史進(jìn)城號(hào)角,也已經(jīng)被吹響。
就在成都車展上,魏牌宣布搭載毫末智行城市NOH的全新摩卡DHT-PHEV激光雷達(dá)版,9月計(jì)劃量產(chǎn),年內(nèi)發(fā)售,上市即交付。
城市NOH(Navigation On HPilot),正是毫末HPilot3.0的核心主打功能,計(jì)劃讓乘用車實(shí)現(xiàn)城市開(kāi)放路況下的端到端智能駕駛。
而一旦交付,也意味著將毫末城市NOH將成為中國(guó)第一個(gè)大規(guī)模量產(chǎn)的城市導(dǎo)航輔助駕駛,將再次刷新量產(chǎn)自動(dòng)駕駛乃至整個(gè)中國(guó)自動(dòng)駕駛賽道的紀(jì)錄。
在現(xiàn)場(chǎng),產(chǎn)學(xué)研大牛對(duì)毫末速度、模式和成績(jī),不僅表達(dá)了一致的認(rèn)可,還認(rèn)為毫末所代表的是自動(dòng)駕駛產(chǎn)業(yè)化落地的前進(jìn)方向。
中國(guó)工程院院士、清華大學(xué)教授、清華大學(xué)智能產(chǎn)業(yè)研究院(AIR)院長(zhǎng)張亞勤說(shuō),毫末成立1000天取得的成就令人矚目,而且堅(jiān)持舉辦的HAOMO AI DAY也是國(guó)內(nèi)非常難得的聚焦AI自動(dòng)駕駛的技術(shù)盛宴,搭建起了一個(gè)行業(yè)技術(shù)交流平臺(tái)。
阿里巴巴集團(tuán)副總裁、知名AI框架大牛賈揚(yáng)清,則認(rèn)為毫末正在自動(dòng)駕駛領(lǐng)域推動(dòng)新的AI技術(shù)工程范式,特別是數(shù)據(jù)智能體系和自動(dòng)駕駛超算打造,或許會(huì)成為全行業(yè)內(nèi)都有影響力的體系。
知名AI芯片公司寒武紀(jì)創(chuàng)始人陳天石,分享了云端和車端正在展現(xiàn)的計(jì)算需求和趨勢(shì),認(rèn)為毫末的速度,站在了趨勢(shì)一方。
△毫末智行“天團(tuán)”:董事長(zhǎng)張凱(左二)、CEO顧維灝(右二)、COO侯軍(左一)、CIO甄龍豹(右一)
所以毫末速度的秘訣是什么?董事長(zhǎng)張凱這次開(kāi)門見(jiàn)山給出了結(jié)論性答案——堅(jiān)定地走漸進(jìn)式發(fā)展路線。在自動(dòng)駕駛的3.0時(shí)代,輔助駕駛是通向自動(dòng)駕駛的必由之路。
張凱表示,目前中國(guó)已成為全球智能汽車主戰(zhàn)場(chǎng),預(yù)計(jì)到2025年,高階輔助駕駛搭載率可達(dá)70%,智能駕駛的時(shí)代風(fēng)口,避無(wú)可避。
之所以確認(rèn)輔助駕駛是通向自動(dòng)駕駛的必由之路,是因?yàn)閿?shù)據(jù)驅(qū)動(dòng)在其中的核心作用。
張凱強(qiáng)調(diào),漸進(jìn)式路線是數(shù)據(jù)積累的最佳路徑越來(lái)越被行業(yè)所公認(rèn),成為自動(dòng)駕駛公司的普遍發(fā)展方向。
毫末模式、毫末速度,就是對(duì)于漸進(jìn)式路線的堅(jiān)定實(shí)踐的結(jié)果,也是自動(dòng)駕駛行業(yè)最快1000天的速度之源。
接下來(lái)的問(wèn)題是如何加速、且可持續(xù)?
Attention大模型加速自動(dòng)駕駛終局?
靠MANA(雪湖),毫末自研建立的國(guó)內(nèi)首個(gè)自動(dòng)駕駛數(shù)據(jù)智能體系。
其中包含了數(shù)據(jù)獲取、傳輸、感知、計(jì)算、驗(yàn)證等多個(gè)子模塊,可以實(shí)現(xiàn)數(shù)據(jù)從輸入到輸出的迭代閉環(huán),這也是毫末可以快速迭代、持續(xù)加速的保障。
在HAOMO AI DAY上,毫末披露了MANA的最新數(shù)據(jù),截至2022年9月,MANA學(xué)習(xí)時(shí)長(zhǎng)超過(guò)31萬(wàn)小時(shí),虛擬駕齡相當(dāng)于人類司機(jī)4萬(wàn)年。
毫末智行CEO顧維灝,還揭秘了MANA如何持續(xù)進(jìn)化的秘訣。
一是來(lái)自產(chǎn)品和落地挑戰(zhàn)的作用力。
二則是不斷吸收最前沿創(chuàng)新技術(shù)。
比如在城市場(chǎng)景的落地中,就存在著4類場(chǎng)景難題、6大技術(shù)挑戰(zhàn)。其中場(chǎng)景難題主要包括“城市道路養(yǎng)護(hù)頻繁”、“大型車輛密集”、“變道空間狹窄”、“城市環(huán)境多樣”等。
與之相對(duì)應(yīng)會(huì)產(chǎn)生6大技術(shù)挑戰(zhàn):
如何在自動(dòng)駕駛領(lǐng)域應(yīng)用大模型?
如何讓數(shù)據(jù)發(fā)揮更大的價(jià)值?
如何使用重感知技術(shù)解決現(xiàn)實(shí)空間理解問(wèn)題?
如何使用人類世界的交互接口?
如何讓仿真更真?
如何讓自動(dòng)駕駛系統(tǒng)運(yùn)動(dòng)起來(lái)更像人?
在4大場(chǎng)景6大挑戰(zhàn)之下,毫末智行對(duì)MANA的感知智能和認(rèn)知智能都進(jìn)行了針對(duì)性升級(jí)調(diào)整。
首先,數(shù)據(jù)標(biāo)注。通過(guò)使用大規(guī)模量產(chǎn)車無(wú)標(biāo)注數(shù)據(jù)的自監(jiān)督學(xué)習(xí)方法,可以實(shí)現(xiàn)模型效果的有效提升,相比只用少量標(biāo)注樣本訓(xùn)練,訓(xùn)練效果提升3倍以上,可以更高效完成訓(xùn)練,更好適應(yīng)感知需求。
其次,增量式數(shù)據(jù)學(xué)習(xí)方法。針對(duì)新增數(shù)據(jù),抽取部分訓(xùn)練數(shù)據(jù)構(gòu)成混合數(shù)據(jù)集,而不是新舊數(shù)據(jù)區(qū)別對(duì)外的方法,更追求新數(shù)據(jù)的擬合和新模型對(duì)齊舊模型的輸出,這樣能讓整體算力節(jié)省80%,響應(yīng)速度提升6倍,也能避免量產(chǎn)車規(guī)模化產(chǎn)生數(shù)據(jù)后,無(wú)法兼顧規(guī)模和效率。
第三,重感知輕地圖,告別高精度地圖依賴。通過(guò)用時(shí)序的Transformer模型在BEV空間上做了虛擬實(shí)時(shí)建圖,使得感知車道線的輸出更加準(zhǔn)確和穩(wěn)定,讓城市導(dǎo)航輔助駕駛不必依賴高精度地圖——這實(shí)際也是更快更低門檻落地城市導(dǎo)航輔助駕駛的必備能力。
第四,車輛信號(hào)燈識(shí)別。通過(guò)車端感知系統(tǒng)升級(jí),對(duì)車輛剎車燈、轉(zhuǎn)向燈狀態(tài)進(jìn)行專門識(shí)別,讓駕駛員在處理前車急剎、緊急切入等場(chǎng)景中更安全和舒適。
第五,仿真系統(tǒng)進(jìn)化。針對(duì)城市最復(fù)雜場(chǎng)景——路口,在仿真系統(tǒng)中引入高價(jià)值的真實(shí)交通流場(chǎng)景,與阿里云、德清政府合作,將路口這一城市最復(fù)雜場(chǎng)景引入仿真引擎,構(gòu)建自動(dòng)駕駛場(chǎng)景庫(kù),通過(guò)自動(dòng)駕駛的真實(shí)仿真驗(yàn)證,時(shí)效性更高、微觀交通流更真實(shí),效破解了城市路口通過(guò)“老大難”問(wèn)題。
值得注意的事,這是中國(guó)首個(gè)基于車路協(xié)同云服務(wù)的大規(guī)模自動(dòng)駕駛場(chǎng)景庫(kù),也是中國(guó)第一個(gè)使用交通數(shù)據(jù)生成的自動(dòng)駕駛場(chǎng)景庫(kù),對(duì)外發(fā)布和應(yīng)用,也標(biāo)志著中國(guó)自動(dòng)駕駛來(lái)到了新階段。
最后,擬人化認(rèn)知。面對(duì)城市路況,如何讓駕駛決策更像人類是公認(rèn)的體驗(yàn)難題。毫末的方法則是通過(guò)對(duì)覆蓋全國(guó)的海量人類駕駛進(jìn)行深度理解,學(xué)習(xí)常識(shí)和動(dòng)作擬人化,讓系統(tǒng)能夠結(jié)合實(shí)際情況選擇最優(yōu)路線保證安全,體感上也更像老司機(jī)。
以上,就是毫末在系統(tǒng)量產(chǎn)上車之后,獲得的數(shù)據(jù)和場(chǎng)景的反饋?zhàn)饔昧Α?/p>
而在另一端,毫末延續(xù)本色,把AI最前沿創(chuàng)新技術(shù)的吸收作為進(jìn)步的另一重保證。
現(xiàn)如今,大模型和Transformer落地應(yīng)用自動(dòng)駕駛已是業(yè)內(nèi)所有玩家的共識(shí),但熟悉行業(yè)前情的人或許多少還有印象,最早把Transformer作為新手段用于感知的,正是毫末。
最新前沿判斷方面,顧維灝此次特別強(qiáng)調(diào)了Attention機(jī)制下的大模型帶來(lái)的驚喜。
Attention大模型背后的機(jī)制,主要是用統(tǒng)一模型的思路解決問(wèn)題,告別不同AI任務(wù)使用專門模型的范式。這種機(jī)制其實(shí)早在2014年便已經(jīng)提出,但主要在NLP領(lǐng)域被應(yīng)用,直到2020年起在計(jì)算機(jī)視覺(jué)領(lǐng)域也取得明顯突破,從谷歌的VIT到微軟的SwinTransformer,輕松刷爆各大排行榜。
基于Attention機(jī)制的Transformer結(jié)構(gòu),更是在各種通用任務(wù)中表現(xiàn)驚人,展現(xiàn)出有效的通用AI模型范式的潛力。
而且Attention機(jī)制結(jié)構(gòu)簡(jiǎn)潔,可以無(wú)限堆疊基本單元得到巨大參數(shù)量模型,隨著參數(shù)提升效果也在提升。
顧維灝認(rèn)為,基于Attention大模型,輔助駕駛獲得的大規(guī)模人機(jī)共駕數(shù)據(jù)就有了更高效地轉(zhuǎn)換,隨著量產(chǎn)車交付和上路,數(shù)據(jù)量不僅大而且足夠多樣,就能更快抵達(dá)自動(dòng)駕駛終局。
這也是毫末認(rèn)為“輔助駕駛是通往自動(dòng)駕駛的必由之路”的技術(shù)底層自信,現(xiàn)階段沒(méi)有比輔助駕駛能更高效地積累到足夠規(guī)模和多樣性的數(shù)據(jù)。
但欲享Attention大模型之利,就得解決其落地之不易。
最核心的就是超大參數(shù)對(duì)于算力的需求:高需求、高成本,高落地難度,讓摩爾定律不再有效。
顧維灝透露,毫末的方法是通過(guò)低碳超算來(lái)降低訓(xùn)練成本,通過(guò)改進(jìn)車端模型和芯片設(shè)計(jì)來(lái)實(shí)現(xiàn)車端落地。云端和終端兩頭并舉,兩頭優(yōu)化。
于是毫末超算中心也正式亮相,成為首個(gè)構(gòu)建超算的自動(dòng)駕駛公司。
毫末方面還透露,毫末超算中心的目標(biāo)是滿足千億參數(shù)大模型,訓(xùn)練數(shù)據(jù)規(guī)模100萬(wàn)clips,整體訓(xùn)練成本降低200倍。
自動(dòng)駕駛的3.0時(shí)代?
量產(chǎn)、規(guī)?;?shù)據(jù)智能……
這是毫末智行談到最多的詞、強(qiáng)調(diào)最多的詞,也是對(duì)于自動(dòng)駕駛發(fā)展階段的最新認(rèn)知的總結(jié)。
在自動(dòng)駕駛的落地探索征程中,有過(guò)路線的劃分,比如Waymo為代表的終極派和特斯拉為代表的漸進(jìn)派;有過(guò)傳感器的陣營(yíng),如激光雷達(dá)陣營(yíng)和純視覺(jué)陣營(yíng);甚至以商用模式為基準(zhǔn),還有To C、To B和To G的劃分。
但如果從第一性原理出發(fā),有沒(méi)有大一統(tǒng)的標(biāo)準(zhǔn)和審視?
毫末智行認(rèn)為:有,而且只有一個(gè)標(biāo)準(zhǔn):數(shù)據(jù)。
按照數(shù)據(jù)的規(guī)模,也能把自動(dòng)駕駛探索大道至簡(jiǎn)劃歸為三個(gè)時(shí)代:
1.0時(shí)代,硬件驅(qū)動(dòng)為主,規(guī)模歷程在100萬(wàn)公里左右,主要感知方式是激光雷達(dá),認(rèn)知?jiǎng)t依賴人工規(guī)則。
2.0時(shí)代,軟件驅(qū)動(dòng)開(kāi)始發(fā)揮作用,規(guī)??梢岳鄯e到1億公里,感知開(kāi)始融合,但依然是不同傳感器單獨(dú)輸出的結(jié)果,認(rèn)知方面依然人工規(guī)則占主導(dǎo),開(kāi)始用小規(guī)模小數(shù)據(jù)實(shí)現(xiàn)更好的預(yù)測(cè)和規(guī)劃。
3.0時(shí)代,數(shù)據(jù)驅(qū)動(dòng)為核心,硬件和軟件在這里實(shí)現(xiàn)了大一統(tǒng),感知也實(shí)現(xiàn)了多模態(tài)傳感器聯(lián)合輸出的大一統(tǒng),認(rèn)知上可以實(shí)現(xiàn)依靠大模型大數(shù)據(jù)擁有可解釋的場(chǎng)景化駕駛常識(shí),能夠驅(qū)動(dòng)1億公里以上的數(shù)據(jù)迭代。
實(shí)際上,按照毫末提出的三個(gè)時(shí)代劃分,不僅很多過(guò)去的自動(dòng)駕駛現(xiàn)象能得到解釋,比如1.0時(shí)代堆砌了激光雷達(dá)的Robotaxi為何還會(huì)有低級(jí)事故,又比如2.0時(shí)代量產(chǎn)車上的高速環(huán)路導(dǎo)航輔助駕駛產(chǎn)品的體驗(yàn)差異……以及特斯拉AutoPilot和FSD的體驗(yàn)確實(shí)在日拱一卒、不斷得到優(yōu)化。
所以更重要的是,毫末提出的這種數(shù)據(jù)維度的劃分,真正能讓自動(dòng)駕駛流派和演進(jìn)萬(wàn)佛朝宗,業(yè)內(nèi)和業(yè)外,都可以有更加客觀的坐標(biāo)和參考。
以前,衡量自動(dòng)駕駛的技術(shù)發(fā)展水平,有過(guò)VC認(rèn)可的維度,有過(guò)自報(bào)MPI的維度,有過(guò)體感體驗(yàn)的維度,也有過(guò)路測(cè)牌照的維度……
但無(wú)一例外都是偏向主觀的維度。
只有量產(chǎn)基礎(chǔ)下的數(shù)據(jù)維度,才接近AI躍遷的原理,才是更加客觀的維度。
而且這也是自動(dòng)駕駛第一階段競(jìng)速的結(jié)果,也是量產(chǎn)落地被作為自動(dòng)駕駛中場(chǎng)哨的原因。
有意思的是,隨著數(shù)據(jù)智能的自動(dòng)駕駛3.0提出,自動(dòng)駕駛領(lǐng)域已然無(wú)壁可面。無(wú)論哪一路線,無(wú)論哪個(gè)陣營(yíng),最核心的競(jìng)爭(zhēng)力都已經(jīng)被放在了明面上——有多大規(guī)模的數(shù)據(jù)?有多高效率的數(shù)據(jù)獲取、訓(xùn)練和利用的能力?
這關(guān)乎迭代速度,也關(guān)于能耗、成本和贏得終局的加速度。
數(shù)據(jù)智能的能力,就是衡量自動(dòng)駕駛公司核心壁壘的指標(biāo)。
數(shù)據(jù)智能的能力,就是自動(dòng)駕駛新階段的分水嶺。
其實(shí)這種分水嶺效應(yīng),之前已經(jīng)在更受關(guān)注的路線之爭(zhēng)中展現(xiàn)。
特斯拉的價(jià)值,在產(chǎn)能問(wèn)題被上海解決后得到了完全認(rèn)可,股價(jià)和市值一飛沖天,馬斯克個(gè)人登頂?shù)厍蚴赘?,AutoPilot和FSD技術(shù)能力越來(lái)越強(qiáng)……而且隨著量產(chǎn)車上路越多,獲取數(shù)據(jù)的規(guī)模越大場(chǎng)景越豐富,這種能力迭代和進(jìn)化就還會(huì)持續(xù)。
作為對(duì)應(yīng),這波自動(dòng)駕駛浪潮的開(kāi)創(chuàng)者Waymo,估值卻被一而再下調(diào),落地和推進(jìn)速度一而再delay,獲取數(shù)據(jù)的規(guī)模和多元性——沒(méi)能展現(xiàn)出更大的增長(zhǎng)趨勢(shì)。
不過(guò),上述已經(jīng)展現(xiàn)的這種分水嶺效應(yīng),之前更多被作為特斯拉和Waymo的“私人恩怨”看待,遮蓋了背后反應(yīng)出的本質(zhì)問(wèn)題。
現(xiàn)在,摸著特斯拉過(guò)河的毫末智行,在敢于天下后的實(shí)踐成果基礎(chǔ)上,把漸進(jìn)式、輔助駕駛更快贏得自動(dòng)駕駛終局的道理喊得響亮,并且用自動(dòng)駕駛3.0的判別式,驗(yàn)證自動(dòng)駕駛公理下的新定律。
這代表著自動(dòng)駕駛的終局之戰(zhàn)已經(jīng)拉開(kāi)了帷幕,也意味著整個(gè)自動(dòng)駕駛江湖,又到了重新洗牌、重估位次的時(shí)候。
至少,是時(shí)候提出這個(gè)問(wèn)題了。