相比遍地開(kāi)花的人臉識(shí)別,智能語(yǔ)音的存在感似乎弱了很多。是錯(cuò)覺(jué)還是現(xiàn)實(shí)?
在AI大廠的老王,做智能語(yǔ)音產(chǎn)品經(jīng)理有幾年了,在語(yǔ)音喚醒、ASR、NLP、TTS方面積累了不少經(jīng)驗(yàn),不過(guò),挖掘語(yǔ)音需求和場(chǎng)景始終是他心頭的一座大山。如何找到足夠好的落地場(chǎng)景?如何將方案和需求精準(zhǔn)匹配?老王覺(jué)得,用戶(hù)的真實(shí)痛點(diǎn)永遠(yuǎn)是個(gè)謎。
小李曾感到幸運(yùn),碩士一畢業(yè)就加入了一家風(fēng)頭正勁的創(chuàng)業(yè)公司做智能語(yǔ)音算法工程師。不過(guò),幾年下來(lái),他感覺(jué)公司業(yè)績(jī)并沒(méi)有很大起色,語(yǔ)音產(chǎn)品只打入了家電和玩具市場(chǎng),量不算大,利潤(rùn)薄得可憐。再反思自己,雖然身邊很多智能硬件也都有了語(yǔ)音控制和交互能力,哪怕天天都在用的手機(jī)也有,但他基本是不用語(yǔ)音功能的。自己尚且如此,其他的消費(fèi)者呢?智能語(yǔ)音功能是偽需求嗎?小李對(duì)當(dāng)年一腳踏進(jìn)的賽道陷入了深深的迷茫中……
從事智能座艙語(yǔ)音交互研發(fā)的大劉,原本在國(guó)際大廠做通用語(yǔ)音平臺(tái),去年被現(xiàn)在的公司挖來(lái),專(zhuān)門(mén)適配車(chē)載場(chǎng)景做語(yǔ)音開(kāi)發(fā)。對(duì)眼下的賽道和薪資,大劉都很滿意,唯一有些焦慮的是,各大品牌紛紛涌入這個(gè)市場(chǎng),“高質(zhì)量、差異化”是老板天天掛在嘴邊的要求?!捌?chē)一定是手機(jī)之后,智能語(yǔ)音落地的大市場(chǎng)”,大劉深信。
十字路口顧盼
老王、小李、大劉可能是語(yǔ)音細(xì)分賽道不同體量、不同方向從業(yè)者在當(dāng)下的縮影。
2015年曾是語(yǔ)音賽道的高光時(shí)刻,中國(guó)智能音箱的發(fā)展正是起步于這一年。語(yǔ)音市場(chǎng)熱度攀高,互聯(lián)網(wǎng)巨頭、產(chǎn)品方案公司,在這一年后紛紛入了局。經(jīng)歷幾年激烈競(jìng)爭(zhēng)后,智能語(yǔ)音公司現(xiàn)在走到了一個(gè)十字路口:向前,落地不及預(yù)期;向左向右,場(chǎng)景需要逐步滲透??梢坏┥狭寺?,就不能原地不動(dòng),更不能后退。
于是只能見(jiàn)到幾家屈指可數(shù)的“老司機(jī)”,平穩(wěn)行駛通過(guò);其他一些對(duì)自家技術(shù)實(shí)力有信心、愿意繼續(xù)沖一把的,正在鉚足勁踩油門(mén),尋求下一個(gè)突破點(diǎn);另一些既沒(méi)有技術(shù)壁壘,又沒(méi)有可持續(xù)盈利場(chǎng)景的公司,已經(jīng)在猶豫要不要踩剎車(chē)……
不得不承認(rèn),整個(gè)智能語(yǔ)音行業(yè)正在經(jīng)歷一輪洗牌,留下真正有技術(shù)實(shí)力、盈利能力強(qiáng)的企業(yè)。 步入冷靜期的智能語(yǔ)音,下一步怎么走?
To B——難挖的富礦
《2020—2021中國(guó)語(yǔ)音產(chǎn)業(yè)發(fā)展白皮書(shū)》顯示,2020年我國(guó)智能語(yǔ)音市場(chǎng)規(guī)模達(dá)到217億元,同比增長(zhǎng)31%,2021年預(yù)計(jì)達(dá)285億元,同比增長(zhǎng)44%。隨著規(guī)模的不斷擴(kuò)大,融合應(yīng)用不斷豐富,智能語(yǔ)音技術(shù)在智慧教育、智慧醫(yī)療、智慧城市、智慧制造等領(lǐng)域加速落地。
不過(guò),有行業(yè)人士指出,廣泛的應(yīng)用領(lǐng)域也就意味著更多元化的使用場(chǎng)景。然而,目前的語(yǔ)音技術(shù)對(duì)于使用場(chǎng)景具有較強(qiáng)的限制性。盡管快速更新迭代的神經(jīng)網(wǎng)絡(luò)架構(gòu)已經(jīng)將安靜環(huán)境下的近場(chǎng)語(yǔ)音識(shí)別的錯(cuò)誤率降低3%以下,但現(xiàn)實(shí)環(huán)境中,多數(shù)應(yīng)用場(chǎng)景無(wú)法滿足理想的環(huán)境條件,在進(jìn)行語(yǔ)音識(shí)別時(shí)需要同時(shí)考慮到各種噪聲、信道等因素。
為了使語(yǔ)音識(shí)別技術(shù)在更廣泛的使用場(chǎng)景下保持良好的表現(xiàn),智能語(yǔ)音廠商需要提供硬件與軟件協(xié)同的一站式服務(wù),并且需要根據(jù)實(shí)際痛點(diǎn)需求進(jìn)行針對(duì)性地優(yōu)化。硬件+軟件+服務(wù),顯然,這是頭部公司才擁有的入場(chǎng)券,對(duì)企業(yè)的全棧能力、數(shù)據(jù)能力要求都較高。
此外,面向企業(yè)、行業(yè)等To B市場(chǎng),語(yǔ)音廠商的上下游合作模式非常關(guān)鍵。例如切入傳統(tǒng)行業(yè)需要提供包括核心設(shè)備的完整解決方案,需要與傳統(tǒng)行業(yè)集成商或最終客戶(hù)進(jìn)行定制化、深度合作,這對(duì)技術(shù)輸出水平、生態(tài)資源等都是較大的挑戰(zhàn)。
車(chē)載——難在“卷”上賽道
語(yǔ)音交互功能是汽車(chē)智能化的重要特征之一,它在汽車(chē)上的優(yōu)勢(shì)比較明顯——能夠幫助駕駛者降低對(duì)車(chē)內(nèi)設(shè)備或其它智能便攜設(shè)備的手動(dòng)操作依賴(lài),增加駕駛安全性。據(jù)億歐智庫(kù)數(shù)據(jù),2021年中國(guó)語(yǔ)音交互車(chē)載應(yīng)用的市場(chǎng)規(guī)模為22.2億元,2022年預(yù)計(jì)可以到達(dá)25.1億元,2019年-2022年復(fù)合增長(zhǎng)率達(dá)到20.8%。2021年中國(guó)新發(fā)布的乘用車(chē),語(yǔ)音交互功能在座艙內(nèi)的滲透率已經(jīng)位于第4位,達(dá)到86%。顯然,語(yǔ)音交互功能已經(jīng)成為中國(guó)乘用汽車(chē)座艙內(nèi)的標(biāo)配功能。
不過(guò),“車(chē)規(guī)級(jí)”語(yǔ)音畢竟不同于普通應(yīng)用場(chǎng)景,有獨(dú)特的挑戰(zhàn)需要克服。主要體現(xiàn)在三方面:
首先,要應(yīng)對(duì)汽車(chē)移動(dòng)狀態(tài)下的網(wǎng)絡(luò)抖動(dòng),在保證聲音保真率的情況下盡量壓縮對(duì)流量及硬件性能的消耗。
第二是語(yǔ)音高保真度帶來(lái)的挑戰(zhàn)。一般情況下,大部分車(chē)載語(yǔ)音系統(tǒng)的語(yǔ)音采樣率為16kHz(一秒鐘有1萬(wàn)6千個(gè)采樣點(diǎn)),量化水平在8比特(每個(gè)采樣點(diǎn)數(shù)據(jù)量為8比特)。但大部分車(chē)載語(yǔ)音模型在采樣率和量化水平上都會(huì)高于這一數(shù)值,這就涉及到高質(zhì)量語(yǔ)音模型與實(shí)時(shí)處理、傳輸?shù)荣Y源的結(jié)合,需要合理規(guī)劃車(chē)身資源與邊緣計(jì)算、云計(jì)算的結(jié)合。
第三個(gè)挑戰(zhàn)主要是合成語(yǔ)音的歧義問(wèn)題,這在所有語(yǔ)音場(chǎng)景中是一個(gè)普遍挑戰(zhàn),只是在不同場(chǎng)景下,用戶(hù)對(duì)歧義的容忍度有差別。特別在車(chē)載場(chǎng)景中,駕駛員注意力需要高度集中,歧義問(wèn)題需要引起重視,減少對(duì)用戶(hù)體驗(yàn)的影響。
目前看來(lái),車(chē)載智能語(yǔ)音產(chǎn)業(yè)鏈的上、中、下游邊界逐漸趨于模糊,競(jìng)爭(zhēng)結(jié)構(gòu)正在重組。以科大訊飛、思必馳、云知聲、捷通華聲等智能語(yǔ)音處理引擎及應(yīng)用供應(yīng)商為例,他們處于產(chǎn)業(yè)鏈中游,作為上游的需求方,業(yè)務(wù)范圍逐漸向上延展;作為下游的供應(yīng)方,合作模式逐漸向下深入。
并且,頭部公司在產(chǎn)品技術(shù)水平、業(yè)務(wù)涵蓋范圍、用戶(hù)生態(tài)等方面具有優(yōu)勢(shì),已經(jīng)占據(jù)了較高的市占率。對(duì)于行業(yè)新秀來(lái)說(shuō),則需要通過(guò)定制化方案、價(jià)格優(yōu)勢(shì)方面尋求更多客戶(hù)資源。
To C——難在碎片中生存
智能語(yǔ)音在消費(fèi)設(shè)備中的典型應(yīng)用包括智能手機(jī)、可穿戴設(shè)備以及小部分智能家居產(chǎn)品等。智能家居市場(chǎng)由于規(guī)模龐大、且正處于智能化升級(jí)期,成為智能語(yǔ)音的主攻方向之一。
經(jīng)過(guò)幾年的市場(chǎng)普及,消費(fèi)者對(duì)語(yǔ)音產(chǎn)品已經(jīng)有初步概念,之前還只是部分單品通過(guò)語(yǔ)音交互實(shí)現(xiàn)智能化,比如智能手環(huán)、智能電視、智能音箱等,而2020年之后,幾乎是全品類(lèi)向語(yǔ)音智能化滲透,包括燈具、開(kāi)關(guān)、空調(diào)、電動(dòng)窗簾、電風(fēng)扇、衛(wèi)浴、廚具等。
不過(guò),智能家居的痛點(diǎn)仍然存在,體現(xiàn)在智能語(yǔ)音領(lǐng)域,具體包括缺乏統(tǒng)一標(biāo)準(zhǔn)和場(chǎng)景化服務(wù)、用戶(hù)體驗(yàn)感差、核心元件國(guó)產(chǎn)化率低等等。
行業(yè)人士認(rèn)為,智能語(yǔ)音在與傳統(tǒng)家居市場(chǎng)的融合過(guò)程中,可能有無(wú)數(shù)的“坑”可能要踩,但一個(gè)首要原則是實(shí)用性,試圖強(qiáng)力改變用戶(hù)習(xí)慣,或是同質(zhì)化的產(chǎn)品,最終都難以規(guī)模化發(fā)展。
其次,在解決設(shè)備只有聯(lián)網(wǎng)才能實(shí)現(xiàn)語(yǔ)音功能的問(wèn)題上,離線語(yǔ)音已經(jīng)顯露出一定的優(yōu)勢(shì)。它能夠針對(duì)性地對(duì)單個(gè)產(chǎn)品進(jìn)行聲音控制,且無(wú)需將數(shù)據(jù)傳向云端,充分保證了用戶(hù)隱私。不論是大家電還是小家電,均可實(shí)現(xiàn)離線語(yǔ)音控制系統(tǒng)的配對(duì)。
此外,一些行業(yè)人士也表示,在激烈且碎片化的語(yǔ)音市場(chǎng)競(jìng)爭(zhēng)中,生態(tài)和商業(yè)模式很關(guān)鍵,技術(shù)和應(yīng)用領(lǐng)先的時(shí)間差很關(guān)鍵。特別在智能家居逐步轉(zhuǎn)向場(chǎng)景化、全屋智能化方向,有望催生出更多非剛需家電品類(lèi)的需求,帶來(lái)增量機(jī)遇,但只有真正便捷、智能化的語(yǔ)音體驗(yàn)才有望成為家電各品類(lèi)產(chǎn)品的標(biāo)配。
寫(xiě)在最后
語(yǔ)音賽道玩家眾多,但盈利仍是多數(shù)企業(yè)的核心挑戰(zhàn)。不同類(lèi)型廠商面臨的挑戰(zhàn)也不同,中游技術(shù)層服務(wù)商研發(fā)投入巨大;下游應(yīng)用環(huán)節(jié),在觸達(dá)行業(yè)核心需求上仍面臨難題。特別是對(duì)于碎片化的智能硬件市場(chǎng),爆款效應(yīng)明顯,如果不能真正起量,將難以擺脫虧損的陰影。在這樣的行業(yè)大環(huán)境中,大部分初創(chuàng)企業(yè)困難重重,而頭部企業(yè)在不斷拓展自身產(chǎn)業(yè)鏈,構(gòu)建完整的生態(tài)結(jié)構(gòu),大者恒大的兩極化發(fā)展態(tài)勢(shì)恐將越來(lái)越明顯。
經(jīng)過(guò)多年發(fā)展,智能語(yǔ)音產(chǎn)業(yè)逐步步入平臺(tái)期,技術(shù)和市場(chǎng)應(yīng)用正面臨著新的挑戰(zhàn)。核心技術(shù)仍有待繼續(xù)突破,下一步發(fā)展的關(guān)鍵創(chuàng)新點(diǎn),除了語(yǔ)音領(lǐng)域的不斷迭代,也需要交叉融合領(lǐng)域的創(chuàng)新。