麥克尼爾的《世界史》被公認(rèn)是全球通史開山之作,他是這樣形容人類文明起源的:當(dāng)文化演化超過生物演化而占據(jù)首要地位時(shí),嚴(yán)格而恰當(dāng)意義上的人類歷史便發(fā)端了。
之所以聯(lián)想到這一典故,是因?yàn)榻陙硖摂M人發(fā)展得如火如荼,已經(jīng)不局限于如何在技術(shù)手段上更像人(生物演化),也開始呈現(xiàn)出文化上的生機(jī)勃勃,廣告代言、舉辦脫口秀、時(shí)尚博主、客服主播等等諸多新身份,也造就了虛實(shí)融合的“新文化”。
近日OPPO 開發(fā)者大會(huì)上更賦予了虛擬人一個(gè)新的能力,成為業(yè)內(nèi)首個(gè)具備虛擬數(shù)字技術(shù)交互體驗(yàn)的手機(jī)智能助手。此外,OPPO 以小布助手為入口,開放了小布生態(tài),未來開發(fā)者可以在平臺(tái)上定制專屬的小布虛擬人,搭載在多個(gè)智能終端設(shè)備上。
從個(gè)體進(jìn)化到群體創(chuàng)生,從技術(shù)概念到商業(yè)生態(tài),從這個(gè)角度來看,虛擬人這一“新物種”的文明歷史,在2021年已經(jīng)正式開啟了。
那么,當(dāng)虛擬人“覺醒”,會(huì)給我們的生活帶來哪些改變?萬物互融時(shí)代,虛擬與現(xiàn)實(shí),數(shù)字世界與物理世界的邊界依然清晰嗎?對(duì)于開發(fā)者來說,為什么虛擬人會(huì)是至關(guān)重要的一種能力、一個(gè)機(jī)會(huì)?
虛擬人覺醒年
說今年是虛擬人技術(shù)的“覺醒年”,并不為過。資本層面,許多虛擬人相關(guān)技術(shù)公司、AI公司都收獲了不少來自頭部互聯(lián)網(wǎng)企業(yè)的投資。消費(fèi)者層面,今年科技企業(yè)也集體亮劍,將更多虛擬人形象推送到大眾面前。大致可以分為三個(gè)流派:
一、偶像派。2020年,由虛擬人技術(shù)創(chuàng)作完成的馬丁·路德·金登上了《時(shí)代周刊》,新一波虛擬人如口紅代言人的LING翎、時(shí)尚博主AYAYI等等,展現(xiàn)出了“帶貨”能力。技術(shù)上使用圖形渲染、動(dòng)作捕捉、語音合成等,嘗試打造出逼真的擬人形象。這類虛擬人,往往需要過硬的作品和內(nèi)容來延續(xù)商業(yè)價(jià)值,比如初音未來、洛天依等虛擬偶像,都有制作音樂專輯、舉辦演唱會(huì)等等,而不局限于一張完美寫實(shí)的仿真臉及人設(shè)。
二、學(xué)術(shù)派。虛擬人要實(shí)現(xiàn)自然流暢的交互,模仿人類的表情動(dòng)作,對(duì)技術(shù)實(shí)力要求很高,這也吸引了許多學(xué)術(shù)機(jī)構(gòu)參與進(jìn)來,比如清華大學(xué)計(jì)算機(jī)系知識(shí)工程實(shí)驗(yàn)室的虛擬學(xué)生華智冰,浙江傳媒學(xué)院和廈門大學(xué)相關(guān)團(tuán)隊(duì)聯(lián)合打造的虛擬人“西小施sisi”等,沒有明確的商業(yè)化場(chǎng)景,主要是向大眾展現(xiàn)虛擬人技術(shù)的最新能力。如果達(dá)不到大眾預(yù)期,或者出現(xiàn)“換臉”之類的負(fù)面新聞,就會(huì)給虛擬人IP蒙上陰影。
三、實(shí)用派。偶像派需要作品,學(xué)術(shù)派考驗(yàn)技術(shù),但企業(yè)還是需要與用戶進(jìn)行有溫度、有情感的互動(dòng)怎么辦呢?于是實(shí)用派虛擬人紛紛登場(chǎng)了。它們大多是由企業(yè)機(jī)構(gòu)與科技公司合作推出的標(biāo)準(zhǔn)化方案,代替真人進(jìn)行內(nèi)容生產(chǎn)和簡(jiǎn)單交互,比如虛擬主持人、數(shù)字航天員、虛擬導(dǎo)游等等。這類虛擬人并不需要高度擬真,技術(shù)難度相對(duì)較低,但也因?yàn)槎ㄖ浦芷诤统杀据^高,無法快速大規(guī)模推廣。
聽上去,似乎虛擬人只能作為一種被觀賞的景觀,停留在數(shù)字世界里。這就夠了嗎?
虛擬人走紅的本質(zhì)原因,是現(xiàn)實(shí)世界與數(shù)字世界之間,需要一種更具視覺化、沉浸式和情感溫度的交互方式。因此,作為兩個(gè)世界溝通的橋梁,虛擬人還有很多想象空間。
舉個(gè)例子,隨著智能技術(shù)的發(fā)展,手機(jī)不僅是各種數(shù)字應(yīng)用服務(wù)的中心,與其他IoT設(shè)備的聯(lián)動(dòng)也成為常態(tài)。萬物智聯(lián)更需要以人為中心,圍繞生活場(chǎng)景和行為習(xí)慣,實(shí)現(xiàn)智能設(shè)備間的無縫協(xié)作,讓用戶更便捷地獲取想要的服務(wù)。
以往這種從硬件到軟件,從技術(shù)能力到服務(wù)應(yīng)用的服務(wù)體驗(yàn),主要是依托智能語音助手來完成的。但是,語音交互更多的是簡(jiǎn)單機(jī)械化的指令,能夠表達(dá)情感的地方很有限,難以撬動(dòng)用戶心中溫柔的情緒,與智能助手形成情感上的連接。更豐富的交互方式,是人機(jī)交互的演進(jìn)方向,而具備語音、語言、3D視覺效果的虛擬人,自然也就成為語音助手的進(jìn)化體。
可以預(yù)見的是,接下來虛擬人將在技術(shù)、場(chǎng)景、產(chǎn)業(yè)的澆灌下,展現(xiàn)出更大的生機(jī)與可能性,成為人機(jī)交互的全新方式。
基于以人為本的用戶洞察,OPPO思考很多,動(dòng)作也很大。就在今年9月,OPPO率先推出了 “小布虛擬人”,又在前不久的ODC開發(fā)者大會(huì)上,將小布升級(jí)為業(yè)界首個(gè)基于虛擬人多模態(tài)交互的手機(jī)智能助手。
一場(chǎng)“新人類”的進(jìn)化
進(jìn)化的過程并不是一蹴而就的,需要在幾個(gè)關(guān)鍵節(jié)點(diǎn)上都發(fā)生正確的“突變”,才能演變出一個(gè)全新的物種。
想要讓虛擬人進(jìn)化成為萬物智聯(lián)、人機(jī)無縫交互的核心,究竟分幾步?今天就以O(shè)PPO小布虛擬人為線索,看看虛擬人的“初長(zhǎng)成”需要解開幾重結(jié)界。
第一重結(jié)界,多模態(tài)融合的交互能力。
我們可以將小布助手,看作是“虛擬人”的胚胎。作為搭載在OPPO智能手機(jī)和IoT設(shè)備上的智能助手,今年2月,小布助手成為國(guó)內(nèi)首個(gè)月活用戶破億的手機(jī)語音助手,而成為人機(jī)交互入口,毫無疑問,小布是一顆極具生長(zhǎng)潛力的“種子”。
如何讓這顆“胚胎”,生長(zhǎng)出自然逼真的感知系統(tǒng)、感官形象、思維大腦,成了“小布虛擬人”生命的起點(diǎn),依賴于語音、視覺、自然語言處理等多模態(tài)融合算法。為此,OPPO多年布局的全棧式AI技術(shù),就成為這一生命體的溫床。
首先,架設(shè)了AI整體技術(shù)架構(gòu),包括混合云基礎(chǔ)設(shè)施、云原生數(shù)據(jù)湖、端云一體機(jī)器學(xué)習(xí)系統(tǒng),以及語音、NLP、知識(shí)圖譜、CV、推薦搜索等AI能力層,跨終端、多場(chǎng)景落地的業(yè)務(wù)應(yīng)用層,為企業(yè)提供安全可信的AI安全能力層……這一基礎(chǔ)架構(gòu)能夠?yàn)樘摂M人所需要的AI能力提供基本的算力、算法、安全等全方位保障。
其次,針對(duì)性打造虛擬人相關(guān)能力。作為有溫度的人機(jī)對(duì)話溝通載體,虛擬人需要在語言、表情、動(dòng)作等方面都自然流暢,這就要求NLP、機(jī)器視覺、TTS語音合成等等多種基礎(chǔ)AI能力都達(dá)到國(guó)際頂級(jí)水平,才能讓用戶不感到違和。為了讓小布虛擬人達(dá)到較高的呈現(xiàn)效果,OPPO技術(shù)團(tuán)隊(duì)今年上線了基于知識(shí)圖譜的NLP預(yù)訓(xùn)練大模型,通過自建知識(shí)圖譜與對(duì)話上下文等信息嵌入,結(jié)合公共以及小布積累的大數(shù)據(jù)集,融合后進(jìn)行大模型預(yù)訓(xùn)練,精準(zhǔn)判斷用戶語言中的意圖。通過UniLM統(tǒng)一預(yù)訓(xùn)練語言模型,生成更貼近上下文的對(duì)話內(nèi)容,讓用戶在與小布助手的交互過程中,能夠?qū)Υ鹑缌?,滿足用戶閑聊的需求,目前滿意度超過85%。
另外,虛擬人還需要展現(xiàn)出聲情并茂的面部表情和肢體語言。為此,OPPO通過ORTC窄帶高清、大規(guī)模低延時(shí)等基礎(chǔ)創(chuàng)新技術(shù),依托小布助手的綜合AI能力,實(shí)現(xiàn)了在多個(gè)場(chǎng)景下與用戶的實(shí)時(shí)情感化交互,讓用戶與小布的交互不會(huì)因?yàn)橛?jì)算處理、網(wǎng)絡(luò)問題而卡頓,變得更加自然、真實(shí)。
基于這些硬核的AI能力,小布虛擬人才變得能聽會(huì)說、活靈活現(xiàn),成為與用戶智趣相投的數(shù)字“生命體”。
第二重結(jié)界,從軟到硬的服務(wù)能力。
人類走向文明的體現(xiàn),是學(xué)會(huì)使用工具來為自己服務(wù)。如果小布虛擬人只能停留在手機(jī)里插科打諢,那和其他虛擬人也就沒什么差異了。
如前所說,OPPO在內(nèi)的硬件廠商早已不局限于手機(jī)這一單品,都在發(fā)力多終端、多場(chǎng)景的智慧生活,這也使得消費(fèi)者對(duì)于打破軟件和硬件之間的結(jié)界,用一個(gè)數(shù)字助手調(diào)度多種硬件的能力,有了迫切的需求。
用一個(gè)詞來總結(jié),就是服務(wù)泛在化。具體有四大特性:人與設(shè)備間的交互將更加自然無感,虛擬世界的真實(shí)渲染與現(xiàn)實(shí)趨于融合,多設(shè)備無縫互聯(lián)互通,服務(wù)體驗(yàn)隨人流轉(zhuǎn)。
對(duì)此,OPPO研究院院長(zhǎng)劉暢認(rèn)為,泛在服務(wù)的趨勢(shì),對(duì)開發(fā)者和平臺(tái)提出了更高更全面的要求。
作為多端融合的服務(wù)調(diào)度工具,小布虛擬人也就具備了“軟硬服一體化”的差異化能力,給消費(fèi)者帶來了實(shí)質(zhì)性的體驗(yàn)改變,也讓自己變得與眾不同、獨(dú)一無二。
面向未來的全新服務(wù)形態(tài),小布虛擬人具體能做些什么呢?
首先是感知,作為用戶與機(jī)器互動(dòng)的入口,通過語音、視覺等多元化信息融合感知,具備數(shù)據(jù)感知、數(shù)據(jù)采集的基本能力,為主動(dòng)服務(wù)提供數(shù)據(jù)養(yǎng)料。
其次是計(jì)算,借助AI大腦的計(jì)算分析處理引擎,將多維信息綜合處理,化繁為簡(jiǎn)變成高效服務(wù)傳達(dá)給用戶,讓無處不在的應(yīng)用功能可以被高效觸達(dá)。
最后是生態(tài),未來除了手機(jī),平板、冰箱等各種帶屏設(shè)備,都需要更具情感色彩的人機(jī)交互,這時(shí)候虛擬人生態(tài)的形成,可以匯聚開發(fā)者和IoT廠商,為消費(fèi)者聯(lián)合打造千人千面的是虛擬人,讓有溫度的智慧服務(wù)無處不在。
從這個(gè)角度看,軟硬服一體化的小布虛擬人,也成為實(shí)現(xiàn)泛在服務(wù)、智慧生活時(shí)代的關(guān)鍵。
第三重結(jié)界,從應(yīng)用到生態(tài)的支撐能力。
應(yīng)對(duì)物競(jìng)天擇,最好的方式是,形成一個(gè)龐大的物種生態(tài)。對(duì)于小布虛擬人來說,要給用戶提供更豐富、更多元的AI服務(wù),無法依靠一家企業(yè)來獨(dú)立完成,需要引發(fā)用戶、開發(fā)者、合作伙伴們的多維互動(dòng)和創(chuàng)意。
以往虛擬人的開發(fā)者是企業(yè)自身,為自有產(chǎn)品和服務(wù)提供支持,運(yùn)營(yíng)模式相對(duì)封閉。如何尋找更多場(chǎng)景激活更多服務(wù),成為虛擬人技術(shù)為用戶提供更多價(jià)值的前提,才能形成欣欣向榮的生態(tài)圖景。
生態(tài)的打造是一件復(fù)雜工程,開發(fā)者們的創(chuàng)意飛揚(yáng),也需要工具、資源、算力等底層支撐。從小布開發(fā)者平臺(tái)中可以看出,OPPO對(duì)開發(fā)者的支持可謂是誠(chéng)意滿滿。
一方面,提供一站式、能力完備的平臺(tái)工具與服務(wù)。小布開發(fā)者平臺(tái),以O(shè)PPO全棧式AI技術(shù)能力為底座,覆蓋了底層的數(shù)據(jù)和算力基礎(chǔ),搭載了各類語音、對(duì)話、視覺、圖譜、多模態(tài)交互等AI基礎(chǔ)能力,上層各類平臺(tái),如BVS語音服務(wù)、AIoT云平臺(tái)、技能平臺(tái)、以及虛擬人定制平臺(tái)。讓設(shè)備接入、虛擬形象定制、功能開發(fā)等都變得便捷高效,每一位開發(fā)者都能定制專屬的小布虛擬人。
另外,開放從軟件、硬件到服務(wù)的OPPO生態(tài)資源,助力“冷啟動(dòng)”。以小布AIoT服務(wù)平臺(tái)BVS為例,就與IoT行業(yè)特別是智能家居行業(yè)展開互動(dòng)合作,IoT廠商的主控設(shè)備如音箱或控制面板,通過BVS可以快速接入小布智能云,開發(fā)者應(yīng)用可以實(shí)現(xiàn)一次開發(fā)、多端觸達(dá),開發(fā)出的虛擬人可以搭載在OPPO生態(tài)中多個(gè)智能終端設(shè)備上(電視、手機(jī)、手表等帶屏設(shè)備),收獲商業(yè)價(jià)值。
時(shí)代考題與OPPO公式,打開產(chǎn)業(yè)之變
對(duì)于開發(fā)者來說,萬物互融時(shí)代,既是潛力無限的金礦,也是一個(gè)充滿殘酷挑戰(zhàn)的競(jìng)賽。
潛力在于,為用戶提供一致的多維多場(chǎng)景體驗(yàn),開發(fā)者能夠觸及更多場(chǎng)景,降低開發(fā)成本,收獲更大的認(rèn)可和商業(yè)成功。
挑戰(zhàn)在于,虛擬人這樣的新物種也是頂級(jí)技術(shù)的綜合體,并且需要產(chǎn)業(yè)配套來推進(jìn),單打獨(dú)斗的普通開發(fā)者很難找到適配自身的場(chǎng)景和突破口。
對(duì)于智能終端品牌來說,與其自筑城池,不如開放自己,成為產(chǎn)業(yè)變革的推動(dòng)力,匯聚開發(fā)者的力量,建立新技術(shù)體系下的話語權(quán)和創(chuàng)新輸出能力。
從此次ODC大會(huì)中我們觀察到,OPPO在重度投入、賦能開發(fā)者上做得非常深入,思考得也很透徹,將其拆解為一道綜合考題。
智慧生活的一道加法題,S多維場(chǎng)景與O全鏈路運(yùn)營(yíng),圍繞人的生活場(chǎng)景和行為習(xí)慣,OPPO將開放統(tǒng)一的連接框架,讓開發(fā)者具備給用戶全場(chǎng)景互聯(lián)互通的服務(wù)能力,實(shí)現(xiàn)全場(chǎng)景、全鏈路的服務(wù)優(yōu)化,可以更容易、更高效、更精細(xì)地找到機(jī)會(huì),擴(kuò)展觸達(dá)用戶的廣度和深度。
人機(jī)交互的一道乘法題,T是OPPO主導(dǎo)的軟硬融合技術(shù),小布能實(shí)現(xiàn)多終端、多模態(tài)的人機(jī)對(duì)話,打造人與設(shè)備間更加自然無感的交互體驗(yàn),為開發(fā)者提供創(chuàng)新源動(dòng)力,獲得必備的AI能力。
泛在智能的一道乘積題。以O(shè)PPO 全棧式AI技術(shù)能力為底座,通過小布實(shí)現(xiàn)智能設(shè)備之間的萬物互融,開發(fā)者可以創(chuàng)作出定制化的虛擬人,和用戶之間進(jìn)行更多形態(tài)的情感化交流,讓虛擬世界和真實(shí)世界之間的交流變得不再單調(diào)和枯燥,進(jìn)而實(shí)現(xiàn)泛在智能的指數(shù)級(jí)增長(zhǎng)。
由此,也形成了下一代生態(tài)勢(shì)能公式NEPE =T(S+O)i生態(tài)模式。
在小布虛擬人身上,我們能看到這一公式的落地應(yīng)用,真正達(dá)到了軟硬兼施、內(nèi)外兼修,OPPO開辟出了一條全新的賽道,這將是產(chǎn)業(yè)改變的初始。
這也讓我們相信,只要技術(shù)不斷澆灌,智慧生活會(huì)在開發(fā)者的想象力中,向更深處進(jìn)化,未來還無盡可能。