加入星計(jì)劃,您可以享受以下權(quán)益:

  • 創(chuàng)作內(nèi)容快速變現(xiàn)
  • 行業(yè)影響力擴(kuò)散
  • 作品版權(quán)保護(hù)
  • 300W+ 專(zhuān)業(yè)用戶
  • 1.5W+ 優(yōu)質(zhì)創(chuàng)作者
  • 5000+ 長(zhǎng)期合作伙伴
立即加入
  • 正文
  • 相關(guān)推薦
  • 電子產(chǎn)業(yè)圖譜
申請(qǐng)入駐 產(chǎn)業(yè)圖譜

為什么越像人的自然語(yǔ)言交互工具,越容易讓人失望?

2019/04/25
38
閱讀需 24 分鐘
加入交流群
掃碼加入
獲取工程師必備禮包
參與熱點(diǎn)資訊討論
從有了 Siri 作為先例,擬人化已經(jīng)成為了自然語(yǔ)言交互工具的必備能力。不論是服務(wù)于個(gè)人用戶的 AI 語(yǔ)音助手,還是企業(yè)提供的智能客服,甚至是各種有語(yǔ)音功能的家用電器,都要做 IP、造人設(shè),幾乎有了成精之勢(shì)。
 
在大多數(shù)時(shí)候,我們認(rèn)為自然語(yǔ)言交互的工具的擬人化可以降低用戶的“恐怖谷效應(yīng)”,讓用戶更喜歡與其交流。但最新的研究結(jié)果卻表明,事實(shí)或許并非如此。
 
成為人類(lèi)的千重套路
首先我們可以來(lái)看看,自然語(yǔ)言交互工具擬人化的“千重套路”。
 
第一步,給自己起一個(gè)人畜無(wú)害的名字。
 
我們常說(shuō),當(dāng)你撿到一只小動(dòng)物后,如果給它起了名字,那么它十有八九會(huì)成為你的寵物。AI 也是一樣,當(dāng)自然語(yǔ)言交互工具擁有姓名,基本就注定了它會(huì)在成精的道路上越走越遠(yuǎn)。自然語(yǔ)言交互工具的名字通常是“小”字輩,既顯得弱小無(wú)害又無(wú)關(guān)性別足夠政治正確。
 
第二步,利用語(yǔ)音生成技術(shù)模仿人類(lèi)語(yǔ)氣。
 
擁有了名字之后,肯定就不能再用冷冰冰的電子音了,甚至以往語(yǔ)音生成技術(shù)管用的真人錄音+規(guī)則匹配的模式也略顯死板。這時(shí)便出現(xiàn)了以谷歌 WaveNet 為代表的神經(jīng)網(wǎng)絡(luò)語(yǔ)音生成,通過(guò)對(duì)真人說(shuō)話方式多種特征的抓取,對(duì)語(yǔ)義、詞性、語(yǔ)法包括上下文等等參數(shù)綜合考慮,最終生成谷歌助手那樣像真人一樣說(shuō)話會(huì)停頓、有思考的語(yǔ)氣。
 
第三步,讓對(duì)話內(nèi)容更加人性化。
 
在自然語(yǔ)言交互的過(guò)程中,語(yǔ)音生成需要建立在文本內(nèi)容之上。滿足了“說(shuō)話語(yǔ)氣”的擬人化,同樣也要讓“說(shuō)話內(nèi)容”更加人性化。這時(shí)語(yǔ)義理解、多輪對(duì)話、自然語(yǔ)言生成等等技術(shù)的成熟度就變得非常重要。例如微軟在微軟小冰上應(yīng)用的全雙工自然語(yǔ)言交互,就能實(shí)現(xiàn)“邊聽(tīng)邊想”和“節(jié)奏控制”——通過(guò)整個(gè)對(duì)話過(guò)程對(duì)用戶意圖進(jìn)行理解,減少用戶的等待時(shí)間,并且能夠主動(dòng)引發(fā)新話題打破沉默,自行調(diào)節(jié)回答的內(nèi)容和時(shí)機(jī)。這樣的對(duì)話內(nèi)容通過(guò)語(yǔ)音生成技術(shù)“展現(xiàn)”出來(lái),就可以以假亂真,讓人以為自己真的在和人類(lèi)對(duì)話。
 
 
最后一步,披上“人皮”。
 
除了技術(shù)之外,還要以一些外圍模式讓自然語(yǔ)言交互工具更加擬人化。比如為它們?cè)O(shè)計(jì)一個(gè)可愛(ài)的卡通形象,增加幾條指令讓它們學(xué)會(huì)一些撒嬌賣(mài)萌的口頭語(yǔ),在交互界面上增加一些細(xì)節(jié)讓人們意識(shí)不到他們?cè)谂c機(jī)器對(duì)話等等。
 
有了這幾步套路,基本就能塑造出一個(gè)“化作人形”的自然語(yǔ)言交互工具了。
 
越人性越可愛(ài)?
自然語(yǔ)言交互工具的期望值管理
 
可我們從未想過(guò)的一個(gè)問(wèn)題是,在實(shí)際應(yīng)用時(shí),自然語(yǔ)言交互工具真的越擬人化越好嗎?最近賓州州立大學(xué)媒體效果研究實(shí)驗(yàn)室就進(jìn)行了這樣一項(xiàng)實(shí)驗(yàn)。
 
研究人員們告知志愿者,他們將在電商平臺(tái)中選購(gòu)數(shù)碼相機(jī),并需要和在線客服交談咨詢(xún)。這些客服背后都是智能自然語(yǔ)言交互系統(tǒng),但研究人員對(duì)其進(jìn)行人性化和響應(yīng)程度上的區(qū)分。不同組的志愿者們分別會(huì)接觸不同的在線客服系統(tǒng),有在對(duì)話時(shí)直接告知對(duì)方自己是機(jī)器客服的,有的只展示出對(duì)話框內(nèi)容,有的會(huì)通過(guò)真人頭像和名字“偽裝”成人類(lèi)。
 
同時(shí)這些擬人程度不同的智能客服,又分別有著不同的響應(yīng)程度。有些可以迅速精準(zhǔn)的回答用戶問(wèn)題,有的卻聽(tīng)不懂人話顧左右而言他。
 
 
在交互過(guò)后調(diào)查實(shí)驗(yàn)者的滿意程度時(shí),結(jié)果卻令人意外。
 
在一般的邏輯中,我們會(huì)認(rèn)為智能客服在交互時(shí)響應(yīng)程度越高,人們的滿意度自然也會(huì)越高??蓪?shí)際情況是,在同樣的響應(yīng)程度下,使用者的滿意程度是與智能客服的人性化程度相關(guān)的。比如同樣的交互內(nèi)容,明確知道對(duì)方是機(jī)器客服的實(shí)驗(yàn)者就會(huì)給出 80 分的滿意度評(píng)價(jià),而那些偽裝成人類(lèi)的機(jī)器客服卻只能獲得 60 分的滿意度評(píng)價(jià)。原因是當(dāng)機(jī)器客服表現(xiàn)出較高的人性化特征時(shí),用戶對(duì)他們的期望程度也會(huì)隨著上升,盼望著他們能和人類(lèi)一樣幫助自己解決問(wèn)題,如果得不到想要的答案,則會(huì)放大失望感。
 
其實(shí)在我們自己應(yīng)用自然語(yǔ)言交互時(shí)也有同樣的感受,當(dāng)語(yǔ)音助手、智能客服等等產(chǎn)品不能解決問(wèn)題還要強(qiáng)行賣(mài)萌講笑話時(shí),我們的暴躁指數(shù)往往會(huì)呈直線上升。
 
說(shuō)到底,自然語(yǔ)言交互的人性化與否是一個(gè)“用戶期望值管理”問(wèn)題,有時(shí)過(guò)度提升用戶期望值反而會(huì)弄巧成拙。
 
做人容易,做工具難
但目前我們能看到一個(gè)重要的趨勢(shì)是,自然語(yǔ)言交互人性和工具性的發(fā)展程度是不均衡的。
 
從技術(shù)發(fā)展的難易程度來(lái)看,讓自然語(yǔ)言交互工具更加接近人類(lèi),遠(yuǎn)遠(yuǎn)要比讓自然語(yǔ)言交互工具更加有效容易得多。
 
不管是谷歌的 WaveNet 還是微軟的全雙工自然語(yǔ)言交互,都足以讓自然語(yǔ)言交互的發(fā)音模式、對(duì)話節(jié)奏等等細(xì)節(jié)無(wú)限接近人類(lèi)。未來(lái)結(jié)合上計(jì)算機(jī)視覺(jué)層面,甚至機(jī)器人制作工藝層面的能力,我們可以打造出一個(gè)與人類(lèi)無(wú)異的對(duì)話者。
 
 
其實(shí)在今天,我們就能看到諸如 AI 主播或 harmony 推出的索菲亞等等在視覺(jué)上極致人性化的“AI 演說(shuō)者”。
 
可這些自然語(yǔ)言交互解決問(wèn)題的能力卻沒(méi)有因此提高。具體表現(xiàn)為:對(duì)于人類(lèi)語(yǔ)料的理解還存在一定隔閡,尤其是小語(yǔ)種、老年人、兒童等等相對(duì)冷門(mén)的語(yǔ)料庫(kù);對(duì)于不同領(lǐng)域詞匯的認(rèn)知還不夠全面,很多時(shí)候涉及到一些垂直產(chǎn)業(yè)時(shí),AI 往往會(huì)進(jìn)入知識(shí)盲區(qū)。
 
如此以來(lái),幫助自然語(yǔ)言交互的“工具性”追趕“人性”或許將成為未來(lái)很長(zhǎng)一段時(shí)間內(nèi)的產(chǎn)業(yè)熱潮。例如建立各個(gè)細(xì)分產(chǎn)業(yè)領(lǐng)域的知識(shí)圖譜、累積詞匯庫(kù),或收集不同人群不同方言語(yǔ)種的語(yǔ)料庫(kù)用于 AI 訓(xùn)練。
 
在技術(shù)的不斷追趕之下,人們對(duì)自然語(yǔ)言交互工具的期望值不斷提高已經(jīng)是一種必然,為了避免出現(xiàn)“短板效應(yīng)”,我們或許應(yīng)該投入更多精力去追求“人性”以外的東西。
谷歌

谷歌

谷歌公司(Google Inc.)成立于1998年9月4日,由拉里·佩奇和謝爾蓋·布林共同創(chuàng)建,被公認(rèn)為全球最大的搜索引擎公司。谷歌是一家位于美國(guó)的跨國(guó)科技企業(yè),業(yè)務(wù)包括互聯(lián)網(wǎng)搜索、云計(jì)算、廣告技術(shù)等,同時(shí)開(kāi)發(fā)并提供大量基于互聯(lián)網(wǎng)的產(chǎn)品與服務(wù),其主要利潤(rùn)來(lái)自于關(guān)鍵詞廣告等服務(wù)。

谷歌公司(Google Inc.)成立于1998年9月4日,由拉里·佩奇和謝爾蓋·布林共同創(chuàng)建,被公認(rèn)為全球最大的搜索引擎公司。谷歌是一家位于美國(guó)的跨國(guó)科技企業(yè),業(yè)務(wù)包括互聯(lián)網(wǎng)搜索、云計(jì)算、廣告技術(shù)等,同時(shí)開(kāi)發(fā)并提供大量基于互聯(lián)網(wǎng)的產(chǎn)品與服務(wù),其主要利潤(rùn)來(lái)自于關(guān)鍵詞廣告等服務(wù)。收起

查看更多

相關(guān)推薦

電子產(chǎn)業(yè)圖譜