市值一夜蒸發(fā)2300億美元后,扎克伯格開(kāi)始拿出“AI黑科技”拯救自己的身價(jià)了!
智東西2月24日消息,就在今天北京時(shí)間凌晨一點(diǎn),扎克伯格特意舉辦了一場(chǎng)名為“元宇宙里的AI”的活動(dòng),專門宣布了Meta在AI領(lǐng)域的技術(shù)布局,這也是扎克伯格2022年首次談及Meta將在語(yǔ)音翻譯、AI創(chuàng)造以及語(yǔ)音助手等領(lǐng)域重點(diǎn)發(fā)力。
會(huì)上,Meta宣布研發(fā)一款為世界上每個(gè)人定制的翻譯軟件,研究人員通過(guò)構(gòu)建高級(jí)的AI模型和一款可適用所有語(yǔ)言的翻譯器,希望能在“元宇宙”中打造一個(gè)無(wú)障礙交流的空間。Meta計(jì)劃研發(fā)一款新的AI系統(tǒng)BuilderBot,你在虛擬世界中說(shuō)什么,AI就能給你展現(xiàn)對(duì)應(yīng)的畫(huà)面,看樣子AI也能成為“阿拉丁神燈”一樣的神器了。
不僅如此,Meta新推出了CAIRaoke項(xiàng)目,研發(fā)人員開(kāi)發(fā)了一個(gè)端到端的神經(jīng)模型,它可以提供與人們進(jìn)行更多的交流,可以比以前簡(jiǎn)單對(duì)話的層面更深一步,能夠理解人們說(shuō)話的語(yǔ)境。最新財(cái)報(bào)顯示,Meta旗下專攻“元宇宙”的Reality Labs部門2021年虧損102億美元。扎克伯格秘藏已久的AI大招,救得了聲勢(shì)漸垮的元宇宙嗎?
▲Meta 2021年股價(jià)變化圖
01.CEO扎克伯格:Meta將發(fā)力語(yǔ)音翻譯和語(yǔ)音助手
扎克伯格談道,現(xiàn)在多數(shù)AI研究的重點(diǎn)是如何讓AI更好地理解現(xiàn)實(shí)世界,但未來(lái),AI需要幫助人們?cè)诂F(xiàn)實(shí)世界和虛擬世界都能實(shí)現(xiàn)導(dǎo)航等功能。并且由于虛擬世界總是在發(fā)生變化,AI應(yīng)該像人類一樣擁有理解環(huán)境和學(xué)習(xí)的能力。
“元宇宙世界中你將會(huì)與任何地方都能發(fā)生視覺(jué)交互,包括你在3D空間中的位置、面部、手勢(shì)等等肢體語(yǔ)言,這些都需要不同的輸入方式。”他認(rèn)為AI是重要的數(shù)據(jù)入口之一。
扎克伯格不但介紹了AI在語(yǔ)音翻譯、語(yǔ)音助手以及AI創(chuàng)造領(lǐng)域的應(yīng)用,還簡(jiǎn)單談了Meta在推動(dòng)AI技術(shù)研究方面所作出的貢獻(xiàn)。
目前,Meta正在打造三個(gè)AI項(xiàng)目。
第一個(gè)是被稱為BuilderBot的AI系統(tǒng),該系統(tǒng)可以讓人們通過(guò)描述虛擬世界的一部分來(lái)構(gòu)建它們。他們通過(guò)一段視頻展示BuilderBot未來(lái)的效果。比如說(shuō),當(dāng)人們身處虛擬世界時(shí),對(duì)這個(gè)系統(tǒng)說(shuō)“我希望天上有片云”,AI將會(huì)自動(dòng)在島嶼上添加一片云。這么一想,如果該系統(tǒng)能夠研發(fā)成功的話,在虛擬世界里“衣來(lái)伸手,飯來(lái)張口”的日子也不遠(yuǎn)了。
第二個(gè)項(xiàng)目是Meta希望打造一款能夠像人類一樣思考的AI。Meta AI的首席AI科學(xué)家楊立昆(Yann LeCun)提出,是否能夠模仿世界的運(yùn)作方式,打造一款“世界模型”的能力可能是該項(xiàng)目的關(guān)鍵之處。“當(dāng)今AI最重要的挑戰(zhàn)之一是設(shè)計(jì)學(xué)習(xí)范式和架構(gòu),使機(jī)器能夠以自我監(jiān)督的方式學(xué)習(xí)世界模型,然后使用這些模型進(jìn)行預(yù)測(cè)、推理和計(jì)劃。”他說(shuō)。楊立昆嘗試運(yùn)用多種學(xué)科中的相關(guān)概念并將它們與機(jī)器學(xué)習(xí)中的新概念相結(jié)合,融入自我監(jiān)督學(xué)習(xí)(self-supervised learning)和聯(lián)合—嵌入式架構(gòu)(joint-embedding architectures)模型中。
第三個(gè)項(xiàng)目則和Meta的“元宇宙”布局相關(guān)。在去年十月的活動(dòng)中,Meta就曾展示過(guò)一個(gè)“萬(wàn)能”的翻譯對(duì)話軟件,現(xiàn)在,這一場(chǎng)景背后的細(xì)節(jié)也逐漸浮出水面。活動(dòng)上,Meta AI宣布將打造一款翻譯工具,該項(xiàng)目將分為兩個(gè)部分推進(jìn)。第一部分是覆蓋全語(yǔ)種,Meta正在構(gòu)建一個(gè)新的高級(jí)AI模型,該模型可以從需要訓(xùn)練的示例更少的語(yǔ)言中學(xué)習(xí),然后實(shí)現(xiàn)數(shù)百種語(yǔ)言的專家級(jí)翻譯。第二部分是打造通用語(yǔ)言翻譯器,研究人員正在設(shè)計(jì)一些新方法,希望能將一種語(yǔ)言的語(yǔ)音實(shí)時(shí)翻譯成另一種語(yǔ)言。
除此之外,扎克伯格也簡(jiǎn)單介紹了一下Meta在隱私保護(hù)、數(shù)據(jù)開(kāi)放等方面做出的貢獻(xiàn)。
Meta與紐約大學(xué)朗格尼醫(yī)學(xué)中心合作開(kāi)展了一個(gè)名為“快速M(fèi)RI”的項(xiàng)目,可以利用AI從較少的數(shù)據(jù)中創(chuàng)建磁共振成像,從而實(shí)現(xiàn)更快的磁共振掃描。
“如果不仔細(xì)考慮我們?nèi)绾我约昂螘r(shí)發(fā)布數(shù)據(jù),就無(wú)法真正推進(jìn)科學(xué)研究。”同時(shí),扎克伯格也提到在發(fā)布數(shù)據(jù)集時(shí),他們會(huì)考慮以隱私和公平為指導(dǎo)原則。
02.為元宇宙打造AI模型Meta打造多款觸摸傳感器
Meta的AI研究人員多年來(lái)一直在討論如何建立一個(gè)豐富的、具有代表性的模型。并且這款新的模型不僅現(xiàn)在能夠?qū)崿F(xiàn)預(yù)測(cè),還可以適用于未來(lái)。
“我們希望模型可以進(jìn)行長(zhǎng)期規(guī)劃和推理,以便未來(lái)在現(xiàn)實(shí)世界和虛擬世界中都能做好AI代理。”Facebook AI Research的總經(jīng)理Joelle Pineau說(shuō)。
此外,她還向大家介紹幾個(gè)Meta正在重點(diǎn)研究的方向,其中有一款是“機(jī)器人”。
“它可以突破實(shí)驗(yàn)室或工廠等固定場(chǎng)景的限制。并且能夠在家中、在辦公室流暢地操作,自然地與人類交互。”Joelle Pineau介紹道,“但我們同樣需要機(jī)器人自己可以觸摸等方式提高感知世界的能力。”
為此,Meta一直在研發(fā)新的觸摸傳感器。Meta正在與其他研究人員合作打造一款新的傳感器,目前該傳感器正處在原型階段。
與其他傳感器不同的是,該觸摸傳感器的外層會(huì)有一層薄薄的膜,膜上嵌有磁性顆粒。當(dāng)觸摸傳感器變形時(shí),磁信號(hào)就會(huì)改變。
通過(guò)這些變化,AI技術(shù)可以推斷接觸點(diǎn)施加力的大小,甚至能使用自我監(jiān)督學(xué)習(xí)模型來(lái)自動(dòng)校準(zhǔn)傳感器,使其更適用于各種場(chǎng)景。
▲觸摸傳感器
不僅如此,Meta還與其他研發(fā)機(jī)構(gòu)合作開(kāi)發(fā)的另一種數(shù)字傳感器。該傳感器的表面由可變形彈性材料組成,能夠通過(guò)傳感器內(nèi)攝像頭記錄的圖像變化來(lái)感受力的變化。
▲數(shù)字傳感器
Joelle Pineau也提到,虛擬世界與真實(shí)世界之間仍有很大差距,要建立一個(gè)可靠的世界模型還有很多工作要做。尤其是,從簡(jiǎn)單的物體到人的全身運(yùn)動(dòng)都能實(shí)時(shí)呈現(xiàn)高分辨率的虛擬環(huán)境。
在演講中,她還宣布Meta的研究人員與Instagram的研究團(tuán)隊(duì)合作,計(jì)劃發(fā)布一個(gè)名為Instagram Feed Ranking的原型系統(tǒng)。
03.打造“萬(wàn)能”翻譯器還支持百種語(yǔ)言自動(dòng)標(biāo)注
機(jī)器翻譯專家Angela Fan認(rèn)為,語(yǔ)言是我們用來(lái)理解與周圍世界互動(dòng)的主要途徑之一。
她介紹自己在加拿大生活以及在巴黎工作時(shí),常常感受到語(yǔ)言障礙帶來(lái)的深遠(yuǎn)影響。基于這些語(yǔ)音溝通壁壘,Meta希望每個(gè)人都能感受到最新的翻譯技術(shù),“我們希望所有未來(lái)的技術(shù)在默認(rèn)情況下都是具有包容性的。”
據(jù)預(yù)測(cè),全球大約有20億人說(shuō)的母語(yǔ)沒(méi)有任何可用的翻譯系統(tǒng)。并且,全球有數(shù)千種語(yǔ)言,但翻譯系統(tǒng)如今只支持大約100種語(yǔ)言。
如何創(chuàng)建真正適合每個(gè)人的翻譯系統(tǒng)是Meta一直在思考的問(wèn)題。
Angela Fan認(rèn)為,創(chuàng)建更具包容性的翻譯的第一步是開(kāi)發(fā)能夠支持多種語(yǔ)言的系統(tǒng)。“我們要是想要實(shí)現(xiàn)多語(yǔ)種翻譯,我們就需要必須為每一個(gè)語(yǔ)言方向創(chuàng)建一個(gè)單獨(dú)的模型,這樣一來(lái),我們就要?jiǎng)?chuàng)建數(shù)萬(wàn)個(gè)模型,這是一件非常復(fù)雜的事情。”
為了解決這一難題,Meta嘗試根據(jù)不同的語(yǔ)言體系來(lái)加強(qiáng)模型的訓(xùn)練能力。比如說(shuō),羅曼什語(yǔ)作為一個(gè)小眾語(yǔ)種,會(huì)與其他語(yǔ)言體系有共同點(diǎn),語(yǔ)種之間的聯(lián)系將會(huì)簡(jiǎn)化語(yǔ)言模型的開(kāi)發(fā)過(guò)程。
“最近,我們?cè)趦蓚€(gè)頂級(jí)翻譯比賽中獲勝。”她講到,“我們證明了多語(yǔ)種系統(tǒng)確實(shí)比雙語(yǔ)系統(tǒng)更好,通過(guò)增加模型大小,例如通過(guò)生成更多培訓(xùn)數(shù)據(jù)和縮小翻譯規(guī)模,我們證明了多語(yǔ)種翻譯是一個(gè)非常有前途的發(fā)展方向。”
除此之外,Meta還可以自動(dòng)創(chuàng)建一些翻譯數(shù)據(jù)的示例,而無(wú)須雇用人員手動(dòng)翻譯大量數(shù)據(jù)。目前,Meta已經(jīng)支持一百多種語(yǔ)言實(shí)現(xiàn)自動(dòng)創(chuàng)建數(shù)據(jù)集,并且部分?jǐn)?shù)據(jù)集開(kāi)源。
04.Meta計(jì)劃打造超級(jí)語(yǔ)音助手連續(xù)決策成AI交互關(guān)鍵
Meta AI的高級(jí)研究經(jīng)理Alborz Geramifard談到語(yǔ)音交互助手可以分為三個(gè)類別。
第一類是初級(jí)的語(yǔ)音助手。比如說(shuō)我們想要查詢?cè)捹M(fèi),打電話給客戶服務(wù),你會(huì)聽(tīng)到請(qǐng)按1鍵獲得話費(fèi)信息,請(qǐng)按2鍵獲得訂閱服務(wù)等。“你常常會(huì)發(fā)現(xiàn)你想要的服務(wù)不在選項(xiàng)列表中”。
第二類語(yǔ)音交互助手,但擁有可能有一些智能模型。“你可能會(huì)在家里和它們簡(jiǎn)單的互動(dòng)。但它們不能理解語(yǔ)義背景,也不能進(jìn)行深度交流。”
第三類是Meta想要打造的超級(jí)語(yǔ)音助手。這類超級(jí)語(yǔ)音助手延續(xù)了深層次的語(yǔ)境,可以為用戶提供個(gè)性化體驗(yàn)。比如你想早晨放一首歌曲,同時(shí)窗外又在下雨,超級(jí)語(yǔ)音助手就會(huì)根據(jù)此刻的場(chǎng)景為你推薦一首歌曲播放。
他還談到,能理解的AI和能交互的AI是兩種不同的概念。能理解的AI是一個(gè)單向的過(guò)程,從輸入到輸出,比如說(shuō)轉(zhuǎn)錄音頻解析可以得到相應(yīng)的文本。
▲理解式AI和實(shí)時(shí)交互AI的區(qū)別
而交互是用戶和AI之間能實(shí)現(xiàn)連續(xù)對(duì)話。例如,詹姆斯可能想向尼克發(fā)送一條消息,說(shuō)他將遲到五分鐘。當(dāng)AI完成相關(guān)操作時(shí),詹姆斯想將時(shí)間修改到10分鐘,在這種情況下,詹姆斯可以繼續(xù)修改他的時(shí)間安排,AI也能完成相關(guān)操作。在交互式的對(duì)話中往往會(huì)涉及連續(xù)決策的問(wèn)題。
“我們的目標(biāo)是將我們的項(xiàng)目打造的新模型與VR/AR設(shè)備相結(jié)合,通過(guò)AI實(shí)現(xiàn)更具沉浸式和多模態(tài)的交互形式。”
比如說(shuō),你的語(yǔ)助手可以幫助你制作美味的食材,根據(jù)你的食譜列出食材,并主動(dòng)引導(dǎo)你完成整個(gè)過(guò)程菜譜。并且,當(dāng)你在這道菜中添加了鹽時(shí),超級(jí)語(yǔ)音助手注意到你的鹽越來(lái)越少了,所以幫助你下了一個(gè)購(gòu)物的訂單。超級(jí)語(yǔ)音助手與你之間的互動(dòng)越來(lái)越緊密。
05.開(kāi)放數(shù)據(jù)集Meta力圖消除數(shù)據(jù)偏見(jiàn)
去年夏天,Meta就曾發(fā)布了文章概述了其AI原則的五大支柱,包括隱私和安全、公平和包容、穩(wěn)健性、安全性、透明度和可控性。
面對(duì)AI公平性,F(xiàn)acebook AI的項(xiàng)目經(jīng)理Jacqueline Pan談到AI團(tuán)隊(duì)與另一個(gè)內(nèi)部團(tuán)隊(duì)合作發(fā)布了一些對(duì)話數(shù)據(jù)集,這些數(shù)據(jù)集旨在幫助評(píng)估AI系統(tǒng)中可能存在的潛在算法。
最新的數(shù)據(jù)集將包含超過(guò)45000個(gè)付費(fèi)參與者進(jìn)行非腳本對(duì)話的視頻,這些參與者透露了他們的年齡和性別,讓AI能夠相對(duì)公正地分析信息。
此外,Meta還能夠提供膚色和聲音的標(biāo)簽,該數(shù)據(jù)集旨在幫助研究人員評(píng)估其計(jì)算機(jī)視覺(jué)和音頻模型在這些維度上的準(zhǔn)確性。
Meta還曾在2020年與佐治亞理工學(xué)院的合作教學(xué)項(xiàng)目,以培養(yǎng)AI人才。
AI研究人員將與佐治亞理工學(xué)院教員一起打磨一門深度學(xué)習(xí)課程開(kāi)發(fā)課程,并作為該大學(xué)計(jì)算機(jī)科學(xué)在線碩士課程的一部分,其主要目標(biāo)是幫助學(xué)生體驗(yàn)現(xiàn)實(shí)世界中學(xué)習(xí)擴(kuò)展算法時(shí)會(huì)用到哪些技術(shù)。
據(jù)統(tǒng)計(jì),第一年就有一千六百多名學(xué)生參加了這門課程,今年有近2400名學(xué)生完成了這門課程。并且,約85%的受訪學(xué)生表示,他們?cè)谠撜n程上收獲頗豐。
06.結(jié)語(yǔ):元宇宙這盤棋,扎克伯格用AI技術(shù)下
說(shuō)起2022的開(kāi)年,扎克伯格是真的慘。自從重壓元宇宙后,扎克伯格一邊成為行走的元宇宙代言,直接帶動(dòng)全球元宇宙熱度,另一邊Meta的股市表現(xiàn)卻愁云慘淡。這家曾躋身美股五巨頭的科技企業(yè),如今卻頹勢(shì)難挽,市值被昔日手下敗將特斯拉、英偉達(dá)、臺(tái)積電、騰訊壓了一頭。
今年2月3日,Meta公布其最新財(cái)報(bào),首次披露的元宇宙部門虧損從2019年45億美元顯著增加到2021年102億美元。當(dāng)天收盤其股價(jià)暴跌26%,創(chuàng)下美股市場(chǎng)歷史最大市值跌幅,市值跌超2370億美元。不僅股價(jià)暴跌、市值縮水,扎克伯格自己也掉出全球富豪榜前10,不可謂不狼狽。顯然,人們對(duì)扎克伯格畫(huà)的元宇宙“大餅”還處于觀望狀態(tài)。
而今日凌晨,扎克伯格完全從技術(shù)角度出發(fā),展示了一套依然緊密圍繞元宇宙藍(lán)圖的前沿AI技術(shù)套餐,以創(chuàng)造一個(gè)更有說(shuō)服力的故事。但華爾街的投資者會(huì)為此買賬嗎?Meta展示的技術(shù)藍(lán)圖,要真正支撐起扎克伯格編織的虛擬世界未來(lái),尚需要一些時(shí)間。
作者 | 徐珊
編輯 | 云鵬