百度的大語(yǔ)言模型文心一言終于“千呼萬(wàn)喚始出來(lái)”。從ChatGPT橫空出世以來(lái),作為第一位推出中國(guó)版ChatGPT的玩家,百度的這場(chǎng)發(fā)布會(huì),讓業(yè)界等得“好辛苦”。特別是就在文心一言發(fā)布會(huì)的前一天,ChatGPT的開(kāi)發(fā)者OpenAI又扔下一枚重磅炸彈——升級(jí)了ChatGPT背后的大模型GPT4,這無(wú)疑讓百度壓力山大。
頂著重重壓力,百度終于邁出這一步,兌現(xiàn)了此前的承諾。發(fā)布會(huì)上,百度創(chuàng)始人、董事長(zhǎng)兼首席執(zhí)行官李彥宏通過(guò)五個(gè)Demo(視頻短片),展示了文心一言在文學(xué)創(chuàng)作、商業(yè)文案創(chuàng)作、數(shù)理推算、中文理解和多模態(tài)生成這五個(gè)使用場(chǎng)景的表現(xiàn)。值得一提的是,在中文理解、多模態(tài)生成等場(chǎng)景上,文心一言做到了ChatGPT沒(méi)做到的事情。
在發(fā)布會(huì)上,李彥宏提問(wèn)文心一言“洛陽(yáng)紙貴”是什么意思?文心一言正確解釋了成語(yǔ)“洛陽(yáng)紙貴”的含義,還按照李彥宏的要求在短時(shí)間內(nèi)用“洛陽(yáng)紙貴”作出了一首藏頭詩(shī)。
中國(guó)版ChatGPT之所以備受期待,部分原因就是博大精深的中國(guó)文化和復(fù)雜的中文語(yǔ)義短期內(nèi)只有掌握中國(guó)用戶數(shù)據(jù)的中國(guó)公司才能具備。作為扎根于中國(guó)市場(chǎng)的大語(yǔ)言模型,百度文心一言具備中文領(lǐng)域最先進(jìn)的自然語(yǔ)言處理能力。“洛陽(yáng)紙貴”這個(gè)例子就比較清楚地展示了百度在中文上的天然優(yōu)勢(shì)。
但李彥宏也坦言,文心一言目前對(duì)英文語(yǔ)種、代碼場(chǎng)景的訓(xùn)練還不夠多,表現(xiàn)還不夠好,這是百度接下來(lái)加緊訓(xùn)練、不斷完善的方向之一。
在生成式AI大模型的演進(jìn)中,多模態(tài)已經(jīng)成為業(yè)界公認(rèn)的發(fā)展趨勢(shì)和競(jìng)爭(zhēng)焦點(diǎn)。昨天OpenAI發(fā)布的GPT4也體現(xiàn)出這一能力——GPT4能夠處理圖片信息以及帶有文本和照片的文檔、圖表或屏幕截圖等圖文交錯(cuò)的信息,并以文字的方式輸出,但并沒(méi)有體現(xiàn)出文字生成圖片、語(yǔ)音甚至視頻的能力。
百度的文心一言卻具備這一能力。發(fā)布會(huì)上,文心一言應(yīng)李彥宏的要求,為2023世界智能交通大會(huì)創(chuàng)作了一張海報(bào),并用四川話講述了“智能交通最適合哪個(gè)城市發(fā)展”,還將上述內(nèi)容生成了一條視頻。
此前,ChatGPT曾在回答中國(guó)經(jīng)典數(shù)學(xué)題“雞兔同籠”問(wèn)題中翻車(chē)。發(fā)布會(huì)上,李彥宏向文心一言提出了“雞兔同籠”的問(wèn)題。文心一言經(jīng)過(guò)演算,認(rèn)為可能是題目出錯(cuò)了,于是李彥宏又重新問(wèn)了一遍,文心一言不但給出了正確的答案,還詳細(xì)給出了解題步驟。
有些遺憾的是,整場(chǎng)發(fā)布會(huì)上,百度并沒(méi)有現(xiàn)場(chǎng)使用“文心一言”展示這些功能,而是采用提前錄好的Demo(視頻)進(jìn)行展示,這也不禁令人聯(lián)想:百度對(duì)文心一言是否還不夠自信?中國(guó)版ChatGPT是否還不夠成熟?畢竟上次谷歌著急推出Bard,結(jié)果發(fā)布會(huì)現(xiàn)場(chǎng)就因?yàn)锽ard答錯(cuò)問(wèn)題而遭受股價(jià)暴跌。
文心一言發(fā)布會(huì)前夕,很多人都在質(zhì)疑百度是否真的Ready了。對(duì)此李彥宏回應(yīng),其實(shí)從某種意義上說(shuō)百度已經(jīng)為此準(zhǔn)備了多年,百度十幾年前就開(kāi)始投入AI研究,2019年就推出了文心大語(yǔ)言模型,今天的文心一言是過(guò)去多年努力的延續(xù)?!暗膊荒苷f(shuō)我們完全Ready了,文心一言對(duì)標(biāo)ChatGPT、甚至是對(duì)標(biāo)GPT-4,門(mén)檻是很高的,我自己測(cè)試感覺(jué)還是有很多不完美的地方?!崩顝┖曛毖?。
從今天的發(fā)布會(huì)來(lái)看,文心一言似乎并不是人們預(yù)期中那樣具有革命性的產(chǎn)品,而更像是對(duì)百度AI技術(shù)儲(chǔ)備的一次中期考驗(yàn),展現(xiàn)百度也有追逐最先進(jìn)人工智能產(chǎn)品的研發(fā)能力。
按照李彥宏的說(shuō)法,百度是全球?yàn)閿?shù)不多、在芯片-框架-模型-應(yīng)用這四層進(jìn)行全棧布局的人工智能公司,從高端芯片昆侖芯,到飛槳深度學(xué)習(xí)框架,再到文心預(yù)訓(xùn)練大模型,到搜索、智能云、自動(dòng)駕駛、小度等應(yīng)用,各個(gè)層面都有領(lǐng)先業(yè)界的自研技術(shù)。AI全棧布局的優(yōu)勢(shì)在于,可以在技術(shù)棧的四層架構(gòu)中實(shí)現(xiàn)端到端優(yōu)化,大幅提升效率。尤其是框架層和模型層之間,有很強(qiáng)的協(xié)同作用,可以幫助構(gòu)建更高效的模型,并顯著降低成本。
除了講產(chǎn)品、講技術(shù),李彥宏還用大量篇幅介紹了自己的生態(tài)——從百度承認(rèn)文心一言的存在到現(xiàn)在,短短一個(gè)月的時(shí)間,已經(jīng)有超過(guò)650家合作伙伴宣布加入文心一言生態(tài)。
這實(shí)則點(diǎn)明了AI得以形成良性商業(yè)循環(huán)的關(guān)鍵點(diǎn)——商業(yè)閉環(huán)。
上一波被譽(yù)為AI風(fēng)潮的締造者——Deepmind推出的阿爾法狗,就是因?yàn)槿狈Ψ夯芰蛻?yīng)用場(chǎng)景而“曇花一現(xiàn)”。因此,這一波的生成式AI浪潮中,OpenAI也開(kāi)始逐漸重視ChatGPT的大規(guī)模商用問(wèn)題——開(kāi)放API,并將使用這項(xiàng)技術(shù)的價(jià)格削減了90%。
雖然‘文心一言’的內(nèi)測(cè)體驗(yàn)不能稱作完美,但為什么現(xiàn)在發(fā)布呢?李彥宏的回答是:“因?yàn)榘俣鹊母鱾€(gè)產(chǎn)品現(xiàn)都在等著這樣的產(chǎn)品,我們的客戶和合作伙伴也在等著這樣的技術(shù)?!?/p>
他斷言,對(duì)于大部分創(chuàng)業(yè)者和企業(yè)來(lái)說(shuō),真正的機(jī)會(huì)并不是從頭開(kāi)始做ChatGPT和文心一言這樣的基礎(chǔ)大模型,這很不現(xiàn)實(shí),也不經(jīng)濟(jì)?;谕ㄓ么笳Z(yǔ)言模型搶先開(kāi)發(fā)重要的應(yīng)用服務(wù),這可能才是真正的機(jī)會(huì)。目前,基于文本生成、圖像生成、音頻生成、視頻生成、數(shù)字人、3D等場(chǎng)景,已經(jīng)涌現(xiàn)出很多創(chuàng)業(yè)明星公司,可能就是未來(lái)的新巨頭。
如果你也期待見(jiàn)到一個(gè)真正的“中國(guó)版 ChatGPT”,不妨再給文心一言時(shí)間和耐心?;蛟S“士別三日,當(dāng)刮目相看”,對(duì)于AI模型更是如此。從目前的Demo來(lái)看,文心一言在基本功能上都能與ChatGPT打個(gè)平手,面向公眾開(kāi)放后,文心一言可以通過(guò)用戶們大量的搜索請(qǐng)求進(jìn)行學(xué)習(xí)和改進(jìn),從而提升處理相應(yīng)問(wèn)題的準(zhǔn)確性和速度。畢竟ChatGPT也是通過(guò)不斷出錯(cuò)、反復(fù)標(biāo)記訓(xùn)練才達(dá)到了今天的高度。