谷歌與Open AI“AI大戰(zhàn)”的真正交火將會(huì)在2024年。
2023年最后一個(gè)月,谷歌發(fā)布了原生多模態(tài)大模型Gemini,稱其在大語(yǔ)言模型領(lǐng)域的32個(gè)常用測(cè)試指標(biāo)里,有30項(xiàng)領(lǐng)先于GPT-4。Gemini針對(duì)不同任務(wù)設(shè)定了Nano、Pro、Ultra三個(gè)版本,目前上線的只是Gemini Pro版,“頂配”Gemini Ultra將于2024年初推出。隨后,谷歌發(fā)布2023年度AI研究總結(jié),給出“全面碾壓OpenAI”的萬(wàn)字長(zhǎng)文。
OpenAI首席執(zhí)行官山姆·奧特曼公布的圣誕愿望清單,可以理解為OpenAI的“應(yīng)戰(zhàn)書(shū)”,并透露將在2024年推出GPT-5。
外界評(píng)論,2024年全球AI大模型比拼的焦點(diǎn)是GPT-5和Gemini Ultra,雖然目前兩個(gè)模型都還被“捂”在閨中,無(wú)法直接比較,但模型之爭(zhēng)背后的數(shù)據(jù)、算力、生態(tài)的全方位較量已經(jīng)開(kāi)始。
1月11日凌晨,OpenAI的GPT Store(GPT應(yīng)用商店) 正式上線,首先面向付費(fèi)用戶開(kāi)放,最終將直接進(jìn)行創(chuàng)收。這意味著“App Store”商業(yè)模式引入大模型領(lǐng)域。也是在這幾天,谷歌DeepMind宣布了SARA-RT、RT-Trajectory、AutoRT三項(xiàng)具身智能成果。
2024年元旦剛過(guò),OpenAI與谷歌AI之爭(zhēng)火藥味彌漫,一場(chǎng)關(guān)于AI核心基礎(chǔ)的變革山雨欲來(lái)。
round1:多模態(tài)數(shù)據(jù),誰(shuí)擁有更多?
2024年大模型的競(jìng)爭(zhēng)焦點(diǎn),業(yè)界的共識(shí)是“多模態(tài)模型”,無(wú)論是GPT-5還是Gemini Ultra,都主打“多模態(tài)”,這意味著訓(xùn)練這些模型需要海量高質(zhì)量的視頻、音頻、圖片等數(shù)據(jù)。
谷歌和Open AI,誰(shuí)更擁有源源不斷的此類資源?
360集團(tuán)創(chuàng)始人、董事長(zhǎng)周鴻祎在與甲子光年創(chuàng)始人兼CEO張一甲的對(duì)話中表示,“人才密度、算力密度和數(shù)據(jù)質(zhì)量的高低是決定通用大模型勝負(fù)的關(guān)鍵,谷歌的人才不是問(wèn)題,算力也不是問(wèn)題,在數(shù)據(jù)方面擁有搜索、YouTube和Android生態(tài)系統(tǒng)”。有消息稱,谷歌訓(xùn)練Gemini時(shí)所用的數(shù)據(jù)量是GPT-4的兩倍之多。
Open AI同樣擁有自己的生態(tài)。如果說(shuō)搜索、短視頻是互聯(lián)網(wǎng)時(shí)代的“超級(jí)應(yīng)用”,大模型時(shí)代,殺手級(jí)應(yīng)用很可能是“AI智能體”,從這個(gè)意義上看,Open AI的GPT商店有可能建立龐大的“AI超級(jí)應(yīng)用”。據(jù)悉,目前用戶自定義構(gòu)建的ChatGPT助手已超過(guò)300萬(wàn)個(gè)。
接下來(lái),數(shù)據(jù)競(jìng)爭(zhēng)的焦點(diǎn)有可能是機(jī)器數(shù)據(jù)。螞蟻集團(tuán)副總裁、金融大模型負(fù)責(zé)人王曉航表示:“有一種說(shuō)法是預(yù)計(jì)2025年左右,全世界50%左右的數(shù)據(jù)會(huì)來(lái)自感知和傳感等IoT(物聯(lián)網(wǎng))數(shù)據(jù),這部分?jǐn)?shù)據(jù)能產(chǎn)生新的能力。”目前的數(shù)據(jù)來(lái)源于傳統(tǒng)計(jì)算平臺(tái),如PC、服務(wù)器、手機(jī)和平板電腦,嵌入式數(shù)據(jù)則來(lái)源于極其廣泛的設(shè)備類型。
因此,大模型與硬件結(jié)合將成為2024年重要的創(chuàng)新方向,也將創(chuàng)造智能硬件新物種。去年11月,由山姆·奧特曼投資的智能穿戴設(shè)備公司推出一個(gè)基于大模型的智能穿戴設(shè)備AI Pin,有人稱其“有可能取代智能手機(jī)”。AI Pin將于2024年3月批量上市。
基于此,我們就很好理解,為什么谷歌Gemini大模型也包括了Nano版本?!爱?dāng)手機(jī)上的傳感器都跟大模型整合,會(huì)產(chǎn)生非常多的應(yīng)用場(chǎng)景,谷歌推出Gemini Nano版本,能夠在終端、手機(jī)等各種設(shè)備上部署,與安卓系統(tǒng)緊密聯(lián)系在一起。”周鴻祎表示。
Pixel 8 Pro 在錄音機(jī)應(yīng)用中使用 Gemini Nano 來(lái)總結(jié)會(huì)議音頻,即使沒(méi)有網(wǎng)絡(luò)連接也可以實(shí)現(xiàn)
大模型的目標(biāo)不僅在于理解文本、圖片、視頻,它必須真正理解物理世界。谷歌Deep Mind首席執(zhí)行官德米斯·哈斯比斯表示:“谷歌DeepMind已經(jīng)在研究如何將Gemini與機(jī)器人技術(shù)結(jié)合,與世界進(jìn)行物理交互,真正的多模態(tài)需要包括觸摸和觸覺(jué)的反饋?!?/p>
2024年元旦剛過(guò),谷歌DeepMind又拿出了SARA-RT、RT-Trajectory、AutoRT三項(xiàng)機(jī)器人與大模型結(jié)合的成果,其中AutoRT是一個(gè)機(jī)器人數(shù)據(jù)收集系統(tǒng),可以一次管理20個(gè)機(jī)器人。而在此前,OpenAI也投資了一家人形機(jī)器人公司1X。谷歌與OpenAI,誰(shuí)都不愿錯(cuò)失任何一個(gè)有可能產(chǎn)生AI爆品的機(jī)會(huì)。
Round2:算力是關(guān)鍵底座,誰(shuí)主動(dòng)權(quán)更大?
在谷歌發(fā)布Gemini大模型時(shí),特別強(qiáng)調(diào)自家的TPU(AI專用張量處理器)v4和v5e對(duì)大規(guī)模訓(xùn)練的給力支撐。為何?因?yàn)樗懔Y源是AI的關(guān)鍵基礎(chǔ)設(shè)施,是AI研究、AI模型訓(xùn)練、AI商業(yè)應(yīng)用的關(guān)鍵利器。有信息透露,谷歌訓(xùn)練Gemini 1.0時(shí)所用算力是OpenAI訓(xùn)練GPT-4的四到五倍。谷歌除了想凸顯自身的算力優(yōu)勢(shì),還要做算力服務(wù)的生意。當(dāng)天,谷歌還發(fā)布了號(hào)稱“迄今為止最強(qiáng)大、最高效、可擴(kuò)展的TPU系統(tǒng)”Cloud TPU v5p,將用于開(kāi)發(fā)更高層次的AI大模型。
在大多數(shù)基準(zhǔn)測(cè)試中,Gemini 的性能都超越了 GPT-4
谷歌這樣做當(dāng)然也希望“打臉”O(jiān)penAI——就在谷歌發(fā)布Gemini前,OpenAI宣布暫停ChatGPT Plus付費(fèi)新用戶的注冊(cè),此前還出現(xiàn)了ChatGPT周期性的宕機(jī)。直到去年12月中旬,?山姆·奧特曼才發(fā)文稱:“我們重新啟動(dòng)了ChatGPT Plus付費(fèi)訂閱的注冊(cè),感謝您的耐心等待,同時(shí)我們找到了更多的GPU?!?/p>
山姆·奧特曼沒(méi)有說(shuō)明,其GPU究竟來(lái)自英偉達(dá)還是微軟,但至少承認(rèn)了一件事:OpenAI缺算力。盡管OpenAI的“好伙伴”微軟已推出AI專用處理器,OpenAI也用上了,甚至還挖來(lái)了前谷歌TPU負(fù)責(zé)人主管OpenAI的硬件,但短期來(lái)看,其算力資源仍無(wú)法與谷歌相提并論。有報(bào)道稱,即便OpenAI在兩年內(nèi)將GPU的總數(shù)增加四倍,依然無(wú)法趕上谷歌的算力資源,目前OpenAI 、Meta、CoreWeave、甲骨文、亞馬遜的GPU總和,仍小于谷歌所擁有的TPU v5的數(shù)量。
算力資源的差距有可能在2024年改變谷歌與OpenAI模型差距,因?yàn)閾碛懈嗟乃懔Y源意味著能進(jìn)行更多的試驗(yàn)、更快的迭代模型。按照SemiAnalysis預(yù)測(cè),到2024年年底,谷歌模型訓(xùn)練的AI算力資源有可能是OpenAI的20倍。
業(yè)界也有人說(shuō),缺算力花錢買就好了,OpenAI正在啟動(dòng)新一輪融資,并不缺錢,自己賺錢能力也蒸蒸日上。最新消息顯示,OpenAI近期年化收入突破16億美元,主要收入來(lái)源包括ChatGPT Plus會(huì)員服務(wù)、API模型訪問(wèn)以及與微軟的合作,預(yù)計(jì)到2024年底OpenAI年化收入可達(dá)50億美元。
更何況,剛剛上線的GPT Store,帶來(lái)OpenAI新的商業(yè)變現(xiàn)的想象空間。
不過(guò),小冰公司CEO李笛認(rèn)為:“GPT Store的建立不是為了商業(yè)模式,更是為了收集究竟什么樣的GPT落地應(yīng)用是有效的,是為了從開(kāi)發(fā)者處獲得想法和靈感。”這樣看起來(lái),OpenAI建立GPT Store的目的并不單純,那么開(kāi)發(fā)者會(huì)不會(huì)把好的創(chuàng)意拿出來(lái),就是未知數(shù)。瀾碼科技創(chuàng)始人、CEO周健也認(rèn)為,當(dāng)前GPT-4的能力對(duì)于發(fā)展GPT store還存在瓶頸,GPT Store開(kāi)發(fā)者是否能夠做出用戶愿意買單的應(yīng)用,需要等到OpenAI發(fā)布GPT-5后才知。
更何況,目前情況看,芯片并不是想買就能買到,OpenAI更不希望淪為GPU和云計(jì)算公司的“打工人”。目前看,OpenAI與微軟的關(guān)系依然牢固,微軟也拿到了OpenAI無(wú)投票資格的董事會(huì)成員資格,但福布斯卻預(yù)測(cè),2024年OpenAI與微軟就有可能走向分手,“隨著OpenAI大到蠶食微軟客戶”。OpenAI還在尋找英偉達(dá)之外其他途徑來(lái)解決眼下算力不足的問(wèn)題,包括最近與AMD洽談合作的可能性,也自主研發(fā)芯片、評(píng)估潛在收購(gòu)目標(biāo)。
基于種種不確定性,OpenAI希望將更多的“算力主動(dòng)權(quán)”掌握在自己手里。最近,OpenAI與人工智能芯片初創(chuàng)公司Rain AI在2019年簽署的一份意向書(shū)被曝出,OpenAI將購(gòu)買該公司總價(jià)值5100萬(wàn)美元的NPU芯片,而在此前,山姆·奧特曼自己也投資了這家公司。這一舉動(dòng)引起廣泛關(guān)注,因?yàn)镽ain AI的NPU芯片采用神經(jīng)擬態(tài)技術(shù),模仿人腦的結(jié)構(gòu)和功能,被認(rèn)為具有低成本高能效的潛力,有望為OpenAI提供所需的硬件支持。
與Rain AI的這一交易,被視為OpenAI為確保其AI項(xiàng)目的芯片和硬件供應(yīng)而進(jìn)行的關(guān)鍵舉措之一。但事實(shí)上這家芯片創(chuàng)業(yè)公司給出的出貨時(shí)間至少要到2024年底。算力的差距,可能在2024年成為OpenAI與谷歌AI競(jìng)爭(zhēng)的“關(guān)鍵變量”。
Round3:醞釀底層變革,誰(shuí)先實(shí)現(xiàn)AGI?
更或許,谷歌與OpenAI的真正較量并不是GPT-5和Gemini Ultra,而是誰(shuí)先實(shí)現(xiàn)AGI(通用人工智能)。
目前看,無(wú)論是GPT還是Gemini 都基于Transformer 架構(gòu)。谷歌團(tuán)隊(duì)在2017年發(fā)表的論文《Attention Is All ?You ?Need》提出了Transformer 架構(gòu),如今的主流大模型產(chǎn)品,大多基于該架構(gòu)。有人分析,谷歌擁有原創(chuàng)AI架構(gòu)、算力、數(shù)據(jù)、技術(shù)、人才等顯著優(yōu)勢(shì),但其推出的Gemini也就僅領(lǐng)先GPT-4一點(diǎn)點(diǎn),這或許意味著Transformer架構(gòu)存在天花板。
Google DeepMind資深工程師盧一峰在與美國(guó)工程院院士張宏江對(duì)話中坦言,“現(xiàn)在的Transformer架構(gòu)已經(jīng)比當(dāng)年有了很大的優(yōu)化和改進(jìn)”,從2016年到現(xiàn)在,整個(gè)業(yè)界在軟件、硬件和數(shù)據(jù)方面對(duì)Transformer架構(gòu)進(jìn)行了許多組合優(yōu)化,“已經(jīng)將其推進(jìn)到了一個(gè)局部最優(yōu)狀態(tài)”?!拔艺J(rèn)為我們可以繼續(xù)改進(jìn)它,還有很大的空間,但要顯著改變它則有一定難度。?這個(gè)難度在于這幾個(gè)維度已經(jīng)彼此交織在一起。”盧一峰說(shuō)。
需要有新的架構(gòu)來(lái)“接力”這場(chǎng)AI加速跑。
福布斯在最近出爐的《2024年十大AI趨勢(shì)預(yù)測(cè)》指出,“盡管我們不認(rèn)為Transformer架構(gòu)在2024年將消失,但確信將出現(xiàn)新一代更先進(jìn)的AI架構(gòu)替代方案,而且新的替代架構(gòu)將會(huì)在2024年得到真正的應(yīng)用?!备2妓乖陬A(yù)測(cè)中提及了斯坦福大學(xué)的Chris Ré實(shí)驗(yàn)室正在構(gòu)建一種新的模型架構(gòu),這種架構(gòu)可隨序列長(zhǎng)度以次二次方的方式擴(kuò)展(而不是像Transformer那樣以四次方的方式擴(kuò)展)。將使得人工智能模型計(jì)算密度更低,并能更好的處理長(zhǎng)序列?!疤娲蜻x”還包括麻省理工學(xué)院開(kāi)發(fā)的液態(tài)神經(jīng)網(wǎng)絡(luò)以及由Transformer聯(lián)合發(fā)明人之一Llion
Jones所創(chuàng)公司推出的Sakana架構(gòu)。據(jù)悉,目前Transformer架構(gòu)的五位共同發(fā)明者均已離開(kāi)了谷歌,開(kāi)啟了各自的AI創(chuàng)新創(chuàng)業(yè)之旅,這些親手孕育了Transformer的人有可能就是Transformer的“掘墓人”。
此外,隨著大模型能力的不斷演進(jìn),需要帶來(lái)“跨越式變革”的未來(lái)計(jì)算,量子計(jì)算機(jī)或許是硬件“接盤”方案。創(chuàng)世伙伴資本主管合伙人周煒表示:“量子計(jì)算擅長(zhǎng)的就是處理排列組合、并發(fā)的問(wèn)題,當(dāng)量子計(jì)算與大模型結(jié)合在一起能夠解決很多問(wèn)題?!?/p>
“首先,人工智能領(lǐng)域的算法,大部分屬于并行計(jì)算范疇。而量子計(jì)算機(jī)擅長(zhǎng)進(jìn)行并行計(jì)算,因?yàn)樗梢酝瑫r(shí)計(jì)算和存儲(chǔ)0、1兩種狀態(tài),無(wú)需像電子計(jì)算機(jī)那樣消耗額外的計(jì)算資源,譬如串聯(lián)多個(gè)計(jì)算單元,或?qū)⒂?jì)算任務(wù)在時(shí)間上并列。計(jì)算任務(wù)越復(fù)雜,量子計(jì)算就越具備優(yōu)勢(shì)。其次,運(yùn)行ChatGPT所需的硬件條件,同樣也十分適合導(dǎo)入當(dāng)前體積龐大的量子計(jì)算機(jī),二者都需要安裝在高度集成的計(jì)算中心里,由一支專業(yè)化技術(shù)團(tuán)隊(duì)進(jìn)行管理支撐?!敝袊?guó)現(xiàn)代國(guó)際關(guān)系研究院科技與網(wǎng)絡(luò)安全研究所人工智能項(xiàng)目負(fù)責(zé)人譚笑間表示。
2022年,來(lái)自谷歌、微軟、加州理工學(xué)院等機(jī)構(gòu)的研究者從原理上證明了“量子優(yōu)勢(shì)”在預(yù)測(cè)可觀測(cè)變量、量子主成分分析以及量子機(jī)器學(xué)習(xí)中確實(shí)存在。量子計(jì)算與人工智能兩大前沿技術(shù)合流的趨勢(shì)正在變得越來(lái)越明朗。在量子計(jì)算、量子機(jī)器學(xué)習(xí)方面,谷歌是先行者。如果量子計(jì)算機(jī)能夠成為未來(lái)AI硬件的替代方案,谷歌無(wú)疑擁有比OpenAI更多的優(yōu)勢(shì)。
谷歌會(huì)比OpenAI更快實(shí)現(xiàn)AGI嗎?亦或,最先實(shí)現(xiàn)AGI的既不是谷歌也不是OpenAI,而是另外其他公司?一切皆有可能。
作者丨特約撰稿??李佳師,編輯丨邱江勇,美編丨馬利亞,監(jiān)制丨連曉東