加入星計(jì)劃,您可以享受以下權(quán)益:

  • 創(chuàng)作內(nèi)容快速變現(xiàn)
  • 行業(yè)影響力擴(kuò)散
  • 作品版權(quán)保護(hù)
  • 300W+ 專業(yè)用戶
  • 1.5W+ 優(yōu)質(zhì)創(chuàng)作者
  • 5000+ 長(zhǎng)期合作伙伴
立即加入
  • 正文
    • “顏控”企業(yè)的出現(xiàn),折射出哪些現(xiàn)實(shí)需求
    • 讓用戶跟 AI 多聊兩句,數(shù)字助理需要具備哪些超能力?
    • AI 語音的下一站,開啟人機(jī)交互的“寧靜時(shí)代”
    • AI 語音助手+X=無限可能
  • 相關(guān)推薦
  • 電子產(chǎn)業(yè)圖譜
申請(qǐng)入駐 產(chǎn)業(yè)圖譜

AI助手賦予人類外貌,語音助手如何打開情感表達(dá)?

2020/09/14
198
閱讀需 14 分鐘
加入交流群
掃碼加入
獲取工程師必備禮包
參與熱點(diǎn)資訊討論

日本聲優(yōu)(配音演員)花澤香菜官宣結(jié)婚的那一天,不少宅男都直呼“爺青結(jié)”(爺?shù)那啻航Y(jié)束了)。互聯(lián)網(wǎng)上被奉為“大眾情人”的男神 / 女神,哪個(gè)不是聲形并茂的存在?

“顏控”如人類的情感就是如此不講道理。所以盡管科技廠商們都努力將 AI 助手的聲音“打扮”得親切可人,但距離真正進(jìn)入用戶心扉還遠(yuǎn)遠(yuǎn)不夠。尤其是對(duì)于智能家居、養(yǎng)老照護(hù)等重要語音落地場(chǎng)景來說,情感色彩的缺位就更加顯現(xiàn)出不足了。

而近期,許多能說會(huì)道的 AI 人物,也逐步進(jìn)入我們的視野。比如《時(shí)代周刊》刊發(fā)了一張馬丁·路德·金的“肖像照片”,“他”還會(huì)在沉浸式展覽《游行》中,重現(xiàn)馬丁·路德·金的經(jīng)典演講《我有一個(gè)夢(mèng)想》。

在許多崗位上,AI 語音助手也開始被賦予真人一樣的外貌,能夠通過眼神、表情、動(dòng)作進(jìn)行自然流暢的表達(dá)。比如疫情期間許多辦公樓里,都引入了數(shù)字人來執(zhí)行測(cè)溫任務(wù),讓這一行為更具溫情,不再是機(jī)器語音例行公事一般冷冰冰的提醒。

騰訊全球數(shù)字生態(tài)大會(huì)上,一位來自《鏡雙城》動(dòng)畫番劇里的女主角那笙,就跟現(xiàn)場(chǎng)觀眾打起了招呼——“原本我只能出現(xiàn)在動(dòng)漫世界里,現(xiàn)在的我能夠讀懂你、聽懂你,還有自己的小個(gè)性、小脾氣哦~”

一副嬌俏少女的模樣,讓這樣的“女神”成為自己的導(dǎo)游、助理、客服、老師等等,聽起來就十分令人神往,是騰訊云小微和 AI lab 共同打造的數(shù)字虛擬人,也成為騰訊云小微“數(shù)字助手”解決方案的“顏值擔(dān)當(dāng)”。

當(dāng)然,讓人類與數(shù)字助理自然相處,其中既受限于理性的技術(shù)發(fā)展周期因素,也會(huì)受到人類虛無縹緲的情感左右。那么作為一種另辟蹊徑的實(shí)現(xiàn)方式,騰訊云小微所打造的形象化 AI 助手,其想象空間到底來自哪里?又將把 AI 語音技術(shù)引向怎樣的下一站?

“顏控”企業(yè)的出現(xiàn),折射出哪些現(xiàn)實(shí)需求

智能語音助手早已在許多商業(yè)場(chǎng)景中落地,比如撥打客服電話時(shí)的語音服務(wù),亦或是會(huì)為兒童朗讀繪本的智能音箱。那為什么大家突然又開始“看臉”了呢?

其實(shí),從智能語音助手中廣泛存在的手機(jī) / 音箱等產(chǎn)品的交互尷尬,就可以解開這個(gè)問題。

首先是打開頻率。許多主打智能語音功能的硬件(比如音箱),只有在剛拿到手的新鮮勁里,或者是網(wǎng)絡(luò)上又出現(xiàn)了“調(diào)戲”語音助手的段子,才會(huì)想起來跟它們對(duì)話。背后的關(guān)鍵原因是語音助理所能承載的工具性需求,大部分都已經(jīng)被智能手機(jī)等設(shè)備完成的很好了,只能作為“備胎”被偶爾提起。

二是情感聯(lián)系。語音交互是即忘形式的,這就決定了它無法承載更具私密性、情感性的交互活動(dòng)。我們會(huì)讓語音助手幫我們打開電視、啟動(dòng)掃地機(jī)器人,但跟它進(jìn)行充滿情緒色彩、大段大段地閑聊?估計(jì)大部分用戶都會(huì)產(chǎn)生抵觸心理。就算自己不介意,被其他人撞到抱著一個(gè)音箱喃喃自語也很難不引起誤會(huì)不是……

三是技術(shù)瓶頸。伴隨著 NLP 技術(shù)的進(jìn)步,語音助手已經(jīng)能很不錯(cuò)地完成聲紋識(shí)別、多輪對(duì)話、語義理解等復(fù)雜任務(wù)了,但距離自然交流顯然還有一定的差距。動(dòng)不動(dòng)就“我聽不懂”“難倒我了”,娛樂消費(fèi)產(chǎn)品會(huì)被棄之高閣,萬一企業(yè)不小心聘用了這種“智障型”AI 助理為消費(fèi)者提供服務(wù),難以達(dá)到普通用戶期盼的準(zhǔn)確無誤、近似真人的交互效果,帶來的就可能是訂單的損失和品牌口碑的下跌。

針對(duì)這些 AI 語音助手在產(chǎn)業(yè)端、市場(chǎng)端的落地尷尬,存不存在可能的解決之道呢?從“工具人”轉(zhuǎn)變?yōu)椤皵?shù)字人”,讓用戶從“聲控”轉(zhuǎn)變?yōu)椤邦伩亍?,就是騰訊數(shù)字生態(tài)大會(huì)上給出的一個(gè)十分吸睛的解題思路。

讓用戶跟 AI 多聊兩句,數(shù)字助理需要具備哪些超能力?

“如果那笙哪里做的不對(duì),主人不要嫌棄我我有在努力呢”——試問聽到這種對(duì)話,你還會(huì)吐槽語音助手偶爾出現(xiàn)的小失誤,甚至還有點(diǎn)想反思自己是不是過于吹毛求疵了呢?

沿著這個(gè)思路,我們可以看到形象化之后,騰訊云小微在數(shù)字助手領(lǐng)域都打造出了哪些超能力:

1. 語音+視覺交互,借助騰訊系海量 IP 打造出各種形象、生動(dòng)、貼近現(xiàn)實(shí)需求的形象,提升交互頻率,從而真正有效地減輕人類工作負(fù)擔(dān)。比如疫情期間,就有老師表示希望有分身到每個(gè)學(xué)生身邊指導(dǎo)他們,而數(shù)字助理的擬人化交互恰好可以完成這一任務(wù);

2. 豐富的知識(shí)體系,利用知識(shí)圖譜與深度學(xué)習(xí)技術(shù),數(shù)字助手可以快速調(diào)用海量信息,完成問答、資訊等服務(wù),再通過擬人化的形象輸出給用戶,人們會(huì)在服務(wù)過程中對(duì)技術(shù)產(chǎn)生一定的包容和理解。為故宮打造的清朝內(nèi)閣大學(xué)士“福大人”,就擔(dān)任起了知識(shí)淵博的游覽助手;

3. 個(gè)性化情感關(guān)系:智能語音助手等新鮮事物的核心受眾群以年輕人為主,而隨著國漫崛起,年輕人對(duì)標(biāo)新立異的虛擬形象更感興趣。而對(duì)于渴求增長(zhǎng)與變化的企業(yè)來說,與其按部就班地在聲音世界里打轉(zhuǎn), 尤其是在線上化業(yè)務(wù)增多,用戶的交互頻率和方式增長(zhǎng)的情況下,年輕市場(chǎng)也需要新的服務(wù)形態(tài)來被重新激活;

此外,伴隨著產(chǎn)業(yè)數(shù)字化程度的推進(jìn),企業(yè)想要在數(shù)據(jù)洪潮中傳達(dá)出具象的品牌形象,新的視覺載體是不可或缺的。消費(fèi)者的行為和決策鏈路也在數(shù)字世界中變得更加隱蔽、復(fù)雜,如何保持黏性,建立用戶與品牌的情感連接也成為應(yīng)有之義……

上述種種,或許都可以通過一個(gè)人格化、陪伴式的“數(shù)字助理”,來觸發(fā)全新的可能性。

AI 語音的下一站,開啟人機(jī)交互的“寧靜時(shí)代”

技術(shù)領(lǐng)域有個(gè)名詞叫“寧靜技術(shù)”,簡(jiǎn)單來說就是通過對(duì)用戶的情景感知能力,最小化用戶的注意力,讓人機(jī)交互變得隱匿和不可見(invisible)。

就像進(jìn)入電梯間之后按下樓層鍵一樣,已經(jīng)成為現(xiàn)代人潛移默化的慣性動(dòng)作,誰還記得曾經(jīng)按電梯也是一種職業(yè),甚至需要考證呢。

而人機(jī)之間的語音交互,也正在從“好像有點(diǎn)尷尬”進(jìn)入到自然而然地喚起階段。接下來,就是要讓這種已經(jīng)在一些場(chǎng)景(比如客廳)成為習(xí)慣的事,隱匿到更大的社會(huì)空間之中,讓 AI 助手能夠在更廣闊的商業(yè)世界里與人們自然順暢地進(jìn)行交流。

這既是技術(shù)發(fā)展的必然趨勢(shì),也離不開科技企業(yè)們的不斷努力。以騰訊云小微 AI 語音助手為例,就已經(jīng)在出行、文旅、教育等等領(lǐng)域開始落地。

之所以能達(dá)成這一成就,首先來自于騰訊在語音技術(shù)上核心技術(shù)鏈的深耕。

通過 ASR、NLP、TTS 等技術(shù),對(duì)聲音進(jìn)行降噪、文本轉(zhuǎn)化、語義理解,這一才能讓 AI 助手能夠在復(fù)雜環(huán)境中依然能夠識(shí)別不同的方言或者口音。

想要達(dá)成和真人一樣的交流,機(jī)器還需要聽得懂,才能避免“所答非所問”的情況,來真正幫助用戶解決問題,成為一個(gè)業(yè)務(wù)能力強(qiáng)大的“數(shù)字員工”。因此騰訊除了在語義技術(shù)方面發(fā)力之外,還十分重視知識(shí)圖譜的建構(gòu)。等于為 AI 搭建了一個(gè)先驗(yàn)的知識(shí)庫,讓它能夠及時(shí)調(diào)動(dòng)龐大的知識(shí)儲(chǔ)備,更好地理解用戶言語的意圖,來顯示出“智商很高”的樣子。

除此之外,數(shù)字員工的“情商”也很重要。利用利用個(gè)性化、沉浸式的 TTS 語音合成技術(shù),再結(jié)合虛擬人技術(shù),將對(duì)話內(nèi)容以多模態(tài)、多層次的形式表達(dá)出來,就能很好地通過表情、動(dòng)作傳達(dá)出語言的情緒,讓用戶更加可感、可知。

而這一整個(gè)技術(shù)體系要真正落地,一方面需要打通數(shù)據(jù)閉環(huán),從而訓(xùn)練出更可靠、精準(zhǔn)的對(duì)話模型。因此騰訊云小微團(tuán)隊(duì)也建構(gòu)了一套系統(tǒng)工程。從沒有數(shù)據(jù)怎么辦開始,系統(tǒng)地鉆研數(shù)據(jù)如何打通,推動(dòng)數(shù)據(jù)共享,到缺失數(shù)據(jù)的采集,系統(tǒng)化地為客戶規(guī)劃了基于數(shù)據(jù)智能化目標(biāo)的數(shù)據(jù)采集和信息化建設(shè)方案。

另外,數(shù)字助理的最終目標(biāo)不是“賣萌”,而是幫助企業(yè)提質(zhì)增效,推動(dòng)數(shù)字生產(chǎn)力變革,達(dá)成體驗(yàn) / 服務(wù)到業(yè)績(jī) / 留存的真實(shí)轉(zhuǎn)化。因此要具備統(tǒng)籌全局、貫穿業(yè)務(wù)周期的能力。所以也需要對(duì)企業(yè)的全業(yè)務(wù)場(chǎng)景進(jìn)行覆蓋,來保證無論是簡(jiǎn)單的問題咨詢,還是復(fù)雜的業(yè)務(wù)流程辦理,抑或只是想跟數(shù)字員工閑聊談心,背后的語音技術(shù)解決方案都能夠通過正確響應(yīng)來滿足用戶所需、企業(yè)所想。在這一點(diǎn)上,騰訊云小微也通過流式語義+語義 VAD 技術(shù),讓 AI 在極低時(shí)延的情況下也能邊聽邊思考。

也正是“數(shù)據(jù)+業(yè)務(wù)”的雙重閉環(huán),形成了數(shù)字助理進(jìn)入產(chǎn)業(yè)規(guī)?;哪芰ψV系,得以為企業(yè)智能化轉(zhuǎn)型全程護(hù)航。

AI 語音助手+X=無限可能

毫無疑問,數(shù)字化、智能化潮流的全面噴發(fā),未來會(huì)有更多的數(shù)字助理、AI 助手被納入到人類的工作環(huán)境當(dāng)中。對(duì)于廣大普通人來說,數(shù)字助理的能力蝶變真的有現(xiàn)實(shí)意義嗎?

答案是肯定的??梢灶A(yù)期的是,至少有幾種社會(huì)生活會(huì)被革新:

一是文旅導(dǎo)游。一場(chǎng)疫情讓旅游行業(yè)元?dú)獯髠?,而防疫的“持久?zhàn)”也決定了限人限流會(huì)成為一段時(shí)期依賴的常態(tài),如何在這樣的情況下依然保持甚至超越原有的服務(wù)質(zhì)量,將基礎(chǔ)講解工作交給數(shù)字員工,就是一個(gè)不錯(cuò)的選擇。未來走進(jìn)景區(qū),打開手機(jī),也許就是一個(gè)數(shù)字導(dǎo)游引領(lǐng)我們游覽,實(shí)時(shí)講解,互動(dòng)答疑;

二是家居場(chǎng)景。你的家里有多少智能音箱在等著落灰?年邁的父母呼喚語音助手的名字時(shí)是否還是會(huì)感到一絲尷尬?而一旦語音助手有了數(shù)字形象,被賦予擬人化色彩之后,一切可能都會(huì)變得不同。從原本的一問一答,到有情感、更自然的交流,大概率會(huì)有不少人開始發(fā)帖“我覺得家里的 AI 助理才是我爸媽親生的”。

三是教育產(chǎn)業(yè)。一進(jìn)九月臨近教師節(jié),家長(zhǎng)群們總少不了“送禮物擔(dān)心老師不收,不送禮物擔(dān)心孩子得不到關(guān)照”的年度討論,而現(xiàn)實(shí)中,確實(shí)存在老師無法針對(duì)學(xué)生進(jìn)行一對(duì)一特定輔導(dǎo)、難以記住所有學(xué)生的學(xué)情狀況、教學(xué)壓力大等情況。能化身虛擬老師的“數(shù)字助手”,無疑就是妥妥的多贏,老師們得以從機(jī)械工作中解放出來,學(xué)生們也能得到實(shí)時(shí)、個(gè)性化的輔導(dǎo),而家長(zhǎng)們也不用發(fā)愁怎樣才能在 AI 眼里刷存在感了。

四是智能營(yíng)銷。對(duì)于企業(yè)來說,數(shù)字助手不僅僅是一位德智體美勞全面發(fā)展的優(yōu)秀員工,還可以是輔助商業(yè)營(yíng)銷決策的“超級(jí)智囊”。舉個(gè)例子,一些汽車小白用戶,通過互聯(lián)網(wǎng)的消費(fèi)行為偏好分析,進(jìn)而設(shè)計(jì)出一些“傻瓜式”產(chǎn)品功能,比如一鍵詢問維修、一鍵呼叫客戶、智能導(dǎo)航、輔助駕駛等等,而這些用戶洞察,基于騰訊云小微所處的數(shù)字生態(tài)都可以轉(zhuǎn)化為車機(jī)企業(yè)爭(zhēng)取潛在用戶好感度的關(guān)鍵武器。

一個(gè)能聽會(huì)說、知識(shí)全面,又善于表達(dá)、喜怒形于色的數(shù)字員工,擁有的可能性還有很多。不難發(fā)現(xiàn),不僅企業(yè)需要重新認(rèn)知數(shù)字助理所帶來的價(jià)值紅利,想要擴(kuò)大數(shù)字助理的商業(yè)價(jià)值與應(yīng)用邊界,還需要一套體系化的平臺(tái)性技術(shù)解決方案,來降低各行各業(yè)引入數(shù)字員工的門檻及成本。

從這一點(diǎn)來看,數(shù)字生態(tài)大會(huì)上所展示的人機(jī)交互技術(shù)前景與商業(yè)宏圖,不是一種偶然,而是騰訊云小微從長(zhǎng)期實(shí)戰(zhàn)與技術(shù)研發(fā)中生長(zhǎng)出來的確定性。

騰訊云小微扳動(dòng)了一下技術(shù)齒輪,人與機(jī)器如同精密儀器適配一樣,在某個(gè)瞬間發(fā)出“咔”的一聲,于是我們知道,一個(gè)全新的產(chǎn)業(yè)世界大門,開啟了……

騰訊

騰訊

騰訊于1998年11月成立,是一家互聯(lián)網(wǎng)公司,通過技術(shù)豐富互聯(lián)網(wǎng)用戶的生活,助力企業(yè)數(shù)字化升級(jí)。我們的使命是“用戶為本 科技向善”。Founded in 1998, Tencent is an Internet-based platform company using technology to enrich the lives of Internet users and assist the digital upgrade of enterprises. Our mission is "Value for Users, Tech for Good".

騰訊于1998年11月成立,是一家互聯(lián)網(wǎng)公司,通過技術(shù)豐富互聯(lián)網(wǎng)用戶的生活,助力企業(yè)數(shù)字化升級(jí)。我們的使命是“用戶為本 科技向善”。Founded in 1998, Tencent is an Internet-based platform company using technology to enrich the lives of Internet users and assist the digital upgrade of enterprises. Our mission is "Value for Users, Tech for Good".收起

查看更多

相關(guān)推薦

電子產(chǎn)業(yè)圖譜