大模型是“大算力+強(qiáng)算法”的產(chǎn)物,是人工智能發(fā)展的趨勢(shì)和未來(lái)。大模型助力AI實(shí)現(xiàn)從“手工作坊”到“工廠模式”的轉(zhuǎn)變,從而使得AI從實(shí)驗(yàn)室走向規(guī)模化的產(chǎn)業(yè)應(yīng)用。大模型通常基于大規(guī)模無(wú)標(biāo)注數(shù)據(jù)進(jìn)行訓(xùn)練,掌握某種特征和規(guī)則;基于大模型進(jìn)行應(yīng)用開(kāi)發(fā)時(shí),將大模型進(jìn)行微調(diào),或者不進(jìn)行微調(diào),就可以完成多個(gè)應(yīng)用場(chǎng)景的任務(wù)。與此同時(shí),大模型具有自監(jiān)督學(xué)習(xí)能力,不需要或很少需要通過(guò)人工標(biāo)注的數(shù)據(jù)進(jìn)行訓(xùn)練,降低了訓(xùn)練成本,因而能夠加快AI的產(chǎn)業(yè)化進(jìn)程,降低AI應(yīng)用的門(mén)檻。通過(guò)不斷迭代,大模型能夠具有更強(qiáng)的通用性以及更高的智能程度,從而使得AI更廣泛地賦能各行業(yè)應(yīng)用。
ChatGPT掀起通用人工智能浪潮
2019年,OpenAI推出參數(shù)量高達(dá)15億的通用語(yǔ)言模型GPT-2,能夠生成連貫的文本段落,實(shí)現(xiàn)初步的閱讀理解、機(jī)器翻譯等。2020年,OpenAI推出超大規(guī)模語(yǔ)言訓(xùn)練模型GPT-3,參數(shù)量達(dá)到了1750億,用兩年左右的時(shí)間實(shí)現(xiàn)了模型規(guī)模從億級(jí)到千億級(jí)的突破,并能夠?qū)崿F(xiàn)作詩(shī)、聊天、生成代碼等功能。2021年1月,谷歌推出的Switch Transformer模型以高達(dá)1.6萬(wàn)億的參數(shù)量成為史上首個(gè)萬(wàn)億級(jí)語(yǔ)言模型。同年12月,谷歌還推出了1.2萬(wàn)億參數(shù)量的通用稀疏語(yǔ)言模型GLaM。可以看到,大型語(yǔ)言模型的參數(shù)量保持著指數(shù)級(jí)增長(zhǎng)的勢(shì)頭。2022年,OpenAI推出的ChatGPT是由比GPT-3更強(qiáng)大的GPT-3.5系列模型提供支持,并且這些模型使用微軟AzureAI超級(jí)計(jì)算基礎(chǔ)設(shè)施上的文本和代碼數(shù)據(jù)進(jìn)行訓(xùn)練。
2022年,ChatGPT突然走紅,這是人工智能大規(guī)模展示通用應(yīng)用場(chǎng)景的開(kāi)始。在此基礎(chǔ)上,生成式人工智能(AIGC)成為了推動(dòng)行業(yè)領(lǐng)域發(fā)展的重要力量。AIGC既是內(nèi)容的分類方式和生產(chǎn)方式,又是用于內(nèi)容自動(dòng)生成的一類技術(shù)集合,AIGC帶動(dòng)了LLM、GPT等大模型的發(fā)展應(yīng)用,為人工智能產(chǎn)業(yè)帶來(lái)了新的變革機(jī)會(huì)。
大模型與AIGC為人工智能領(lǐng)域帶來(lái)了新變化。從當(dāng)前大模型的發(fā)展趨勢(shì)看,大模型企業(yè)更傾向于搭建平臺(tái),對(duì)傳統(tǒng)企業(yè)進(jìn)行賦能。具體而言,大模型企業(yè)憑借對(duì)組織型用戶“痛點(diǎn)”的了解,搭建大模型平臺(tái),而組織型用戶只需加入自己獨(dú)有的場(chǎng)景數(shù)據(jù),即可快速生成解決自身問(wèn)題的“專屬模型”。不過(guò),這種提供定制解決方案的模式也面臨開(kāi)源模式帶來(lái)的挑戰(zhàn)。
LLaMA2開(kāi)源改變大模型游戲規(guī)則
ChatGPT發(fā)布后,Meta緊跟著推出了類GPT大語(yǔ)言模型LLaMA。模型公布后不久,LLaMA因?yàn)樵创a泄露引來(lái)了大量開(kāi)發(fā)者的關(guān)注,在ChatGPT熱度下降的情況下,LLaMA成為產(chǎn)業(yè)關(guān)注的“新寵”。
2023年前5個(gè)月,ChatGPT全球訪問(wèn)量增長(zhǎng)幅度明顯下降,6月的訪問(wèn)量更是環(huán)比下滑9.7%,為其自推出以來(lái)首次大幅度下滑。7月,Meta發(fā)布首個(gè)開(kāi)源人工智能模型LLaMA的商業(yè)版本LLaMA2,該商用大模型可為企業(yè)提供OpenAI和谷歌的替代方案,該模型也因此被視為“最強(qiáng)平替”。需要特別說(shuō)明的是,LLaMA2運(yùn)行在Windows操作系統(tǒng)之上,整合了Azure云,原本與OpenAI長(zhǎng)期深入合作的微軟已成為L(zhǎng)LaMA2的“首選合作伙伴”。
Meta針對(duì)LLaMA2的開(kāi)源模式做了如下表述:“我們相信,開(kāi)源的方法是當(dāng)今人工智能模型發(fā)展的正確途徑,尤其是在技術(shù)進(jìn)步日新月異的生成式人工智能領(lǐng)域?!蓖ㄟ^(guò)開(kāi)源的方式吸引足夠的參與者,從而搭建一套完善的生態(tài)系統(tǒng),是Meta這類互聯(lián)網(wǎng)企業(yè)的一貫作風(fēng),但對(duì)于已投入大量成本而期望采用定制化解決方案的玩家而言,卻不是什么好消息。
Meta的操作讓人聯(lián)想到Facebook的開(kāi)源計(jì)算項(xiàng)目OCP,該項(xiàng)目被用于改變服務(wù)器硬件的制造方式,以更好地適應(yīng)互聯(lián)網(wǎng)時(shí)代。OCP除了對(duì)應(yīng)的機(jī)架規(guī)范Open Rack,還包括服務(wù)器、網(wǎng)絡(luò)、存儲(chǔ),乃至數(shù)據(jù)中心的設(shè)計(jì)。OCP被視為Facebook最為重要的科技項(xiàng)目之一,旨在把“開(kāi)源”概念引入數(shù)據(jù)中心硬件,為數(shù)據(jù)中心提供更快、更便宜、用材更少的硬件。
OCP的開(kāi)放性體現(xiàn)在免費(fèi)提供設(shè)計(jì),任何企業(yè)都可以使用它,并對(duì)其進(jìn)行調(diào)整,這意味著,惠普、戴爾和思科這類傳統(tǒng)硬件供應(yīng)商將不再控制產(chǎn)品設(shè)計(jì),取而代之是由用戶自己控制。這給思科等硬件制造市場(chǎng)的老玩家?guī)?lái)了很大威脅,因?yàn)镺CP很有可能為企業(yè)提供更便宜、更靈活的替代方案,從而淘汰傳統(tǒng)的昂貴方案。微軟、蘋(píng)果等科技巨頭都加入了OCP陣營(yíng),開(kāi)始把OCP的一些概念整合到自身的數(shù)據(jù)中心,形成新的生態(tài)。Facebook也通過(guò)構(gòu)建在OCP基礎(chǔ)上的各種技術(shù),大大減少了對(duì)“思科們”的依賴。
LLaMA2的開(kāi)源模式可能會(huì)影響OpenAI等公司在生成式人工智能軟件市場(chǎng)中取得的早期主導(dǎo)地位。因?yàn)镸eta意在借助LLaMA2構(gòu)建人工智能開(kāi)源生態(tài)系統(tǒng),快速擴(kuò)大其市場(chǎng)規(guī)模并建立口碑,同時(shí)阻礙競(jìng)爭(zhēng)對(duì)手從其專有技術(shù)中賺取收入。
Apple GPT入局,前路未知
在Meta、微軟、OpenAI等公司各出奇招的同時(shí),以封閉系統(tǒng)作為競(jìng)爭(zhēng)優(yōu)勢(shì)的Apple等公司也在借助Siri等人機(jī)交互觸點(diǎn)的優(yōu)勢(shì)向上游拓展。近期,業(yè)內(nèi)傳出Apple秘密研發(fā)Apple GPT的消息。
據(jù)了解,Apple GPT是一款基于蘋(píng)果自研Ajax框架開(kāi)發(fā)的人工智能工具,這一產(chǎn)品已在蘋(píng)果內(nèi)部小范圍內(nèi)投入使用。與其他解決方案不同的是,目前Apple尚未決定Apple GPT未來(lái)的開(kāi)發(fā)方向,甚至嚴(yán)格規(guī)定了Apple GPT的使用場(chǎng)景,禁止將其輸出用于開(kāi)發(fā)面向用戶的功能。這體現(xiàn)了不同企業(yè)對(duì)大模型市場(chǎng)發(fā)展的不同理解和判斷,同時(shí)也體現(xiàn)了“利用大模型做未來(lái)物聯(lián)網(wǎng)入口的可能性和交互能力的升級(jí)”這種定位和發(fā)展方向的選擇。
大模型時(shí)代的人工智能倫理風(fēng)險(xiǎn)
開(kāi)源大模型將加速人工智能市場(chǎng)的應(yīng)用拓展,但與此同時(shí),人工智能哲學(xué)尤其是科技倫理方面的爭(zhēng)議甚囂塵上,大模型的可靠性、安全性、知識(shí)產(chǎn)權(quán)等也成為了產(chǎn)業(yè)亟待解決的新課題。大模型目前還面臨較大的挑戰(zhàn),包括大模型“幻覺(jué)”、“一本正經(jīng)地胡說(shuō)八道”、政企私有數(shù)據(jù)的保密性要求、大模型存在封閉性等,同時(shí)信息壟斷、知識(shí)產(chǎn)權(quán)等問(wèn)題也不容忽視。
知識(shí)可靠性及信息誤導(dǎo)等問(wèn)題
ChatGPT不能保證回答問(wèn)題的可靠性和準(zhǔn)確性,對(duì)于“如果相同的問(wèn)題在不同時(shí)間問(wèn)你有不同的結(jié)果,我怎么知道哪一個(gè)比較可信,或者哪一個(gè)更為接近真相”這個(gè)問(wèn)題時(shí),ChatGPT給出了如下答復(fù):“作為一種人工智能系統(tǒng),我是基于一組固定的算法和數(shù)據(jù)運(yùn)行的,并且在回答問(wèn)題時(shí)會(huì)遵循程序化的邏輯。因此,如果對(duì)同一個(gè)問(wèn)題多次詢問(wèn),答案應(yīng)該是一致的,除非模型的數(shù)據(jù)或算法發(fā)生了更改。不過(guò),即使我的回答是一致的,也不能完全保證答案的正確性和可靠性,因?yàn)槲业挠?xùn)練數(shù)據(jù)和算法可能存在偏見(jiàn)或錯(cuò)誤,我并不能獨(dú)立判斷我回答的問(wèn)題是否符合真實(shí)情況?!?/p>
ChatGPT要學(xué)習(xí)大量的文本數(shù)據(jù),并以特定的算法處理數(shù)據(jù),因此可通過(guò)提供誤導(dǎo)性訓(xùn)練數(shù)據(jù)或者改變算法,操控處理結(jié)果。也就是說(shuō),我們不能準(zhǔn)確理解作為“黑盒”的數(shù)據(jù)處理模型,以及信任ChatGPT采用的訓(xùn)練數(shù)據(jù)集的“權(quán)威性”,即便在一個(gè)我們熟悉的領(lǐng)域,細(xì)微的差別也可能導(dǎo)致巨大的結(jié)論偏差。
從知識(shí)可靠性的角度看,知識(shí)應(yīng)用的場(chǎng)景需要非常謹(jǐn)慎,尤其是在學(xué)術(shù)研究領(lǐng)域,必須嚴(yán)格限制ChatGPT信息的引用。
信息壟斷問(wèn)題
如果模型的使用和控制都是不透明的,就有可能出現(xiàn)信息壟斷。信息壟斷是指一個(gè)或一些組織及個(gè)人控制著信息的生產(chǎn)、流通和使用,從而有效地排除競(jìng)爭(zhēng)。因此,如果行業(yè)不采用透明公開(kāi)的方式去評(píng)估和監(jiān)督使用信息,那么就可能存在信息壟斷的風(fēng)險(xiǎn)。
知識(shí)產(chǎn)權(quán)問(wèn)題
ChatGPT由OpenAI訓(xùn)練,數(shù)據(jù)集是從互聯(lián)網(wǎng)上收集來(lái)的大量文本數(shù)據(jù),包含新聞報(bào)道、維基百科條目、小說(shuō)、博客、論壇帖子、技術(shù)文檔、社交媒體內(nèi)容等信息,這些數(shù)據(jù)可能存在著作權(quán)侵權(quán)的風(fēng)險(xiǎn)。
具體而言,OpenAI嘗試遵循合法、道德的原則來(lái)獲取數(shù)據(jù),但并不能保證所有數(shù)據(jù)的著作權(quán)擁有者都同意OpenAI將其數(shù)據(jù)用來(lái)訓(xùn)練語(yǔ)言模型。風(fēng)險(xiǎn)在于數(shù)據(jù)的處理結(jié)果是構(gòu)建在未經(jīng)授權(quán)的第三方經(jīng)驗(yàn)之上,而通過(guò)這些經(jīng)驗(yàn)獲得的價(jià)值并沒(méi)有與第三方共享,或者說(shuō)他們甚至都沒(méi)有意識(shí)到自己的數(shù)據(jù)被使用。在現(xiàn)實(shí)世界中肖像權(quán)被侵犯是比較明顯的,在數(shù)字世界中經(jīng)過(guò)多重加工以后,這樣的侵權(quán)行為就不是那么明顯。
在現(xiàn)實(shí)世界中可能會(huì)出現(xiàn)這樣的情況:ChatGPT的回答可能無(wú)意之間引用了作者聲明需要分享商業(yè)收益的內(nèi)容,在不知情的情況下侵犯了作者的知識(shí)產(chǎn)權(quán)。此外,經(jīng)過(guò)復(fù)雜的模型處理之后,文本的所有者可能很難知道ChatGPT對(duì)他的資產(chǎn)進(jìn)行了處理,也就是說(shuō),盡管理論上文本的所有者可以去維權(quán),但實(shí)踐成本會(huì)非常高。
針對(duì)這個(gè)問(wèn)題,ChatGPT是這樣回應(yīng)的:“確實(shí)存在難以識(shí)別使用者行為的問(wèn)題。不過(guò)我是一個(gè)由OpenAI制作并管理的計(jì)算機(jī)程序,并且OpenAI是一個(gè)認(rèn)真對(duì)待知識(shí)產(chǎn)權(quán)和隱私的公司,他們遵循相關(guān)法律法規(guī),努力確保這些法律法規(guī)在用戶使用我的過(guò)程中得到遵循。當(dāng)然,如果您發(fā)現(xiàn)有任何違反知識(shí)產(chǎn)權(quán)的情況,建議您及時(shí)聯(lián)系OpenAI,以幫助他們解決問(wèn)題。”
能否用于解決具有創(chuàng)造性的問(wèn)題
這個(gè)問(wèn)題看起來(lái)更像是一個(gè)人工智能的哲學(xué)問(wèn)題??茖W(xué)發(fā)展的傳統(tǒng)看法是:科學(xué)知識(shí)是不斷增加的,發(fā)展是一個(gè)直線的、知識(shí)積累的過(guò)程。這是為大多數(shù)人所接受的科學(xué)發(fā)展觀,也是ChatGPT體現(xiàn)出來(lái)的知識(shí)“歸納”,其文字編碼的概率讓結(jié)果體現(xiàn)出這樣的特征。波普證偽主義強(qiáng)調(diào)的不是知識(shí)的積累,而是科學(xué)理論的更替,舊理論不斷被推翻,新理論取而代之。
大模型帶來(lái)了強(qiáng)大的智能,能夠推動(dòng)人工智能向更高級(jí)的智能應(yīng)用邁進(jìn),例如AIGC、更智能的對(duì)話客服等。GPT-3等大模型在新聞文本生成、商業(yè)文本分析、法律文本分析等領(lǐng)域具有較高的產(chǎn)業(yè)應(yīng)用價(jià)值。除問(wèn)答以外,ChatGPT能夠完成編程、寫(xiě)稿等眾多超出人們想象的任務(wù)。谷歌公司曾表示:“如果ChatGPT參加谷歌的面試,理論上會(huì)得到入門(mén)級(jí)程序員的聘任。因此,更為關(guān)鍵的是我們?cè)趺蠢斫狻畡?chuàng)造性’這個(gè)詞的含義?!?/p>
結(jié)語(yǔ)
無(wú)論如何,大模型僅僅是生成式人工智能大規(guī)模商用的前奏,許多領(lǐng)域的企業(yè)都在嘗試將大模型能力與自身的優(yōu)勢(shì)、定位和戰(zhàn)略發(fā)展方向結(jié)合起來(lái)。無(wú)論是從打造難以被模仿的技術(shù)優(yōu)勢(shì)、大模型能力與復(fù)雜場(chǎng)景結(jié)合構(gòu)建更強(qiáng)的解決方案能力、借助開(kāi)源模式降低大模型使用門(mén)檻形成規(guī)?;瘔艛?,還是借助傳統(tǒng)的觸點(diǎn)優(yōu)勢(shì)進(jìn)一步提升終端用戶的體驗(yàn),市場(chǎng)上不同的玩家都在根據(jù)自身的理解嘗試定義大模型的未來(lái)。而在通向未來(lái)的道路上,大模型將比其他領(lǐng)域面臨更多的倫理、法律、道德方面的難題,這也是大模型企業(yè)在打造市場(chǎng)競(jìng)爭(zhēng)力的同時(shí),面臨的新課題。
*本文刊載于《通信世界》總第927期 2023年9月10日 第17期
原文標(biāo)題:《國(guó)外大模型發(fā)展分析》
作者:云晴
責(zé)編/版式:王禹蓉
審核:舒文瓊
監(jiān)制:劉啟誠(chéng)