作者|董楠,郵箱|dongnan@pingwest.com
去年號稱大模型技術元年,智能座艙的演進進入了新階段:大語言模型上車。
智能座艙通過運用大模型,將提供千人千面的語音識別、娛樂信息,以及駕駛輔助的個性化定制服務,讓座艙具有了深度進化的能力。
新能源、電動化、大模型就這樣把智能座艙推向了新階段,其中大語言模型更成為車企推動座艙交互的重要技術手段,借助AI,很多智能汽車都號稱座艙中擁有了一個更懂你的虛擬助理。
AI的強大一定會來帶座艙交互的強大嗎?如今的智能座艙,尤其是語音交互是否真的帶來了顛覆式的體驗?同時,隨著車企們力推大模型上車,新技術加持下的不同車型,如何來實現(xiàn)智能座艙的差異化?
你的車機可能沒有想象中懂你
隨著大語言模型上車,很多車企在用戶體驗層面,也更注重座艙的語音交互以及多屏互動能力,這其中,大語言模型發(fā)揮的作用就是,以其知識儲備及語義理解能力進行擬人交互,提升座艙交互,尤其是與車機對話的體驗。
所以在如今的新車中,我們也可以發(fā)現(xiàn),可見即可說、連續(xù)交互能力、個性化的娛樂信息已經(jīng)成為智能座艙交互的新賣點。
但是很多調(diào)研中都顯示,用戶對自家汽車的座艙交互仍然有諸多不滿意。
比如,隨著更多新車開始配備副駕屏、后排屏,用戶與屏幕的交互體驗并沒有顯著提升。
比如,對于基于用戶的個性化信息生成能力,很多車型并沒有因為大模型上車而增強。
目前,借助車內(nèi)語音助手,很多用戶頻繁使用的功能主要集中在車輛控制,和簡單的問答。而與車機的深度對話能力,很多用戶在體驗幾次后就放棄了。
交互內(nèi)容不夠豐富、語義理解能力不夠,娛樂推薦不夠個性化,隨著汽車進入大模型元年,距離用戶期待的定制化座艙體驗,似乎并沒有一步到位。
一方面,很多車企的大語言模型訓練數(shù)據(jù)是基于固定的通用語料庫,這意味著大模型在訓練后無法實時更新信息,也就是說,很多大模型本身的基座模型,其訓練語料依然停留在某一個版本的節(jié)點,而非實時更新。
對于在線實時更新信息的訓練,現(xiàn)階段的大語言模型仍然是匱乏的。
另一方面,大語言模型上車,并不意味著就能帶來足夠的內(nèi)容專業(yè)性。
如今家庭用車市場火爆,在一家人出行的場景中,經(jīng)常會遇到一個問題,熱愛提問的小朋友總是隨時提問,很多問題家長也不能馬上解答。
這種場景如果發(fā)生在車上,就非??简炚Z音助手的能力了。
在大語言模型的研究中就有專業(yè)人員提到,大語言模型本質(zhì)上只是文本生成器,如果文本不是表現(xiàn)的最佳形式或不是表達的任務,大語言模型的表現(xiàn)就會受到限制。
這時候就要借助“外掛”的幫助,而聯(lián)網(wǎng)智能體,在此時就能很好地發(fā)揮作用。
聯(lián)網(wǎng)智能體可以補充大模型在線知識,拓展大語言模型的能力。
當語音助手可以調(diào)用足夠的內(nèi)容信息,再基于自己的能力去理解回答,此時的語音助手才會更加強大。
其實燃油車的座艙交互并不一定都拉垮
隨著新能源、智能化的深入,在技術層面我們已經(jīng)了解到,電動車架構為整車智能打下了技術基礎,讓新能源汽車成為了汽車智能化的急先鋒。
在這種對比之下,燃油車就成了智能汽車時代的“落后分子”。
而事實上,所謂的傳統(tǒng)車企并沒有放棄智能化,目前市場上一些燃油車型的座艙交互能力也不比新能源汽車差。
比如最近改款的某豪華車品牌的新車型,最大的變化就在智能座艙層面。
該豪華品牌車型不但升級了8295芯片、第三代智能交互系統(tǒng),還可以支持AI生成場景和個性化場景。比如,升級后的讀心語音助理,讓這樣一款老牌兒燃油車的座艙,也具備了基于用戶習慣的專屬場景模式。
該豪華品牌在座艙層面的軟硬件迭代,讓其座艙得到了“重生”。
燃油車們在努力補強智能化短板的同時,如今市場上很多號稱搭載8295芯片、大模型上車的新能源汽車,在座艙交互層面的能力表現(xiàn)差異依然很大。
這是因為,當前的大模型技術依然沒有充分挖掘出可利用的數(shù)據(jù)信息和服務場景,因此,它所提供的智能化水平和交互能力,在眼下還有很大的進階空間。
如今車企都在積極擁抱大模型,并將智能座艙作為大模型的切入點。
并且,目前汽車市場中,新能源汽車與燃油車幾乎各占一半市場份額。這也意味著,基于不同的細分市場和定位,燃油車同樣在強化個性的智能化體驗,借助數(shù)字化技術尋求升級。
新能源汽車則在挑戰(zhàn)智能交互的新高度,在推動智能座艙快速滲透的同時,整個汽車行業(yè)在智能化層面,也進入了一個前所未有的激烈競爭中。
國泰君安的調(diào)研顯示,2021年,中國市場智能座艙新車滲透率為50.6%,2024年中達到72.1%,2025年,其滲透水平預計將超過75%。
當然,我們必須面對一個現(xiàn)實:
大模型賦能智能座艙雖然已經(jīng)成為主流趨勢,但是座艙多模態(tài)交互與個性化內(nèi)容體驗在短時間內(nèi)并不會因此被拉到新的高度。
大模型生態(tài),推動人機交互更進一步
雖然沒有先天的架構優(yōu)勢,但是該豪華車品牌擅長利用生態(tài)圈資源。
8月,該豪華車品牌與火山引擎簽署戰(zhàn)略合作備忘錄,雙方計劃在大模型、生成式人工智能(AI)和大數(shù)據(jù)等前沿技術領域展開深入合作,目的在于重點提升智能座艙的多個核心功能。
實際上,在過去火山引擎與該豪華車品牌的合作中,就通過結合車輛駕駛特性、便捷性,激發(fā)用戶探索興趣,提升車上用車體驗,完成車+生活端的基礎打通。這樣做,一方面提升了該豪華車品牌在家庭場景形象、智能交互體驗、激發(fā)駕駛探索樂趣;同時能夠擴大該豪華車的品牌議價,通過開啟生活的新終端,為后續(xù)車上服務提供接口,植入生活、旅行等新場景提供可能。
聯(lián)網(wǎng)智能體為該豪華車品牌帶來了符合其品牌調(diào)性的座艙交互場景。實際上,它的能力還有很多。
火山引擎聯(lián)網(wǎng)智能體通過提供互聯(lián)網(wǎng)內(nèi)容,可以幫助大語言模型擴展其實時信息獲取能力,實時搜索網(wǎng)絡并生成答案,實現(xiàn)實時性更高、更新、更全面的回答,從而提升用戶體驗和回答效果。
火山引擎聯(lián)網(wǎng)智能體演示
那么,首先當然要清楚,火山引擎聯(lián)網(wǎng)智能體的資源來自于哪里。實際上,這一聯(lián)網(wǎng)智能體背靠整個抖音集團內(nèi)容生態(tài),比如抖音、西瓜視頻、頭條,這些都是音視頻領域頭部且不可復制的內(nèi)容資源。
另一層面,我們也需要知道,大模型時代,聯(lián)網(wǎng)智能體能起到什么作用。
基于內(nèi)容資源優(yōu)勢,聯(lián)網(wǎng)智能體能夠提升大模型能力的信息增強和交互增強。其中包括:提供大模型自身無法獲取的信息,提升回答效果;同時,在C端展示內(nèi)容卡片,并視頻化解讀用戶問題,升級交互體驗。
也就是說,除了文本式的常規(guī)回答,聯(lián)網(wǎng)智能體還可以進行視頻解讀,比如展示一道菜的做法,推薦有趣的地方。
這對于目前很多定位為家庭用車、配備了副駕屏、后排娛樂屏的多屏幕車型來說,就可以利用屏幕,豐富交互的場景化。
火山引擎聯(lián)網(wǎng)智能體在與車企的合作中,也會基于車型來及其用戶定位,來進行定制化調(diào)整。
一方面,借助聯(lián)網(wǎng)智能體更為豐富的信息,以及其本身的大模型推理能力,先將內(nèi)容經(jīng)過預選分類梳理,檢索過程垂直內(nèi)容知識場景,讓內(nèi)容信息更精準。在人與語音助手的交互中,在通用泛化的問答場景里,給出最優(yōu)組合答案。
同時,這種交互不但提升了與車內(nèi)語音助手的交流能力,也能改變車載端人找內(nèi)容的傳統(tǒng)模式,通過大模型加持的助理場景建立內(nèi)容觸達的新模式。
內(nèi)容層面,火山引擎聯(lián)網(wǎng)智能體主要是聚焦三個車主需求:查詢問題、娛樂消費、出行決策。這也是如今智能座艙中需求最高但難以被充分滿足的場景。
如今,大模型上車已經(jīng)成為很多車企推動智能化轉(zhuǎn)型的新趨勢,與此同時,智能座艙作為核心功能,在加速向汽車市場滲透的同時,也是用戶最為關心的體驗之一。
如何帶來更高層次、更具差異化的智能座艙交互體驗,火山引擎聯(lián)網(wǎng)智能體提供了一個可行性路徑,對于致力于大模型探索的車企,更能起到事半功倍的效果。