2023年,生成式AI在科技領(lǐng)域異軍突起。隨著ChatGPT獲得了巨大的成功,亞馬遜、微軟和谷歌等公司紛紛加快步伐,掀起了一股創(chuàng)新浪潮,以重塑企業(yè)和用戶(hù)利用科技提高生產(chǎn)力的方式。生成式AI已在制藥和法律等多個(gè)領(lǐng)域取得了顯著進(jìn)展,但這只是一個(gè)開(kāi)始。根據(jù)麥肯錫的調(diào)查,中國(guó)企業(yè)人工智能與業(yè)務(wù)相結(jié)合的能力有很大的進(jìn)步空間,當(dāng)前只有9%的中國(guó)企業(yè)可借助AI實(shí)現(xiàn)10%以上的收入增長(zhǎng)。只有當(dāng)企業(yè)走出實(shí)驗(yàn)階段,開(kāi)始在實(shí)際應(yīng)用中更廣泛地使用生成式AI時(shí),其真正的作用才能更好地展現(xiàn)。
但是,想要將生成式AI的價(jià)值最大化,企業(yè)必須克服成本和信任的挑戰(zhàn)。而要做到這一點(diǎn),就需要一個(gè)充分利用云的強(qiáng)大數(shù)據(jù)路線圖。
成本和信任是最大的障礙
在生成式AI應(yīng)用中,如果模型是基于不可信的數(shù)據(jù)訓(xùn)練而成的,它生成有用結(jié)果的可能性就會(huì)很小。當(dāng)前的挑戰(zhàn)在于,許多企業(yè)的數(shù)據(jù)治理和安全仍處于初級(jí)階段,關(guān)鍵信息往往被鎖在孤島中。如果不進(jìn)行高成本的整合,這些信息實(shí)際上是無(wú)法被使用的。在實(shí)踐中,這意味著AI訓(xùn)練數(shù)據(jù)的質(zhì)量可能很差,缺乏關(guān)鍵的業(yè)務(wù)背景。這可能會(huì)導(dǎo)致幻覺(jué),即看似真實(shí)的虛構(gòu)信息或缺乏必要背景的事實(shí)反應(yīng)。無(wú)論哪種情況,都對(duì)企業(yè)無(wú)益。
另一個(gè)關(guān)鍵痛點(diǎn)是自主運(yùn)行生成式AI項(xiàng)目的成本高昂。雖然外包存在安全、合規(guī)和其他潛在風(fēng)險(xiǎn),但自主完成所有工作的成本過(guò)于高昂。一個(gè)專(zhuān)門(mén)用于運(yùn)行大語(yǔ)言模型(LLM)的尖端GPU大約需要3萬(wàn)美元。而一家企業(yè)如果要運(yùn)行一個(gè)擁有1750億個(gè)參數(shù)的模型,可能需要2000個(gè)GPU,成本高達(dá)數(shù)千萬(wàn)美元。
將實(shí)驗(yàn)室中的生成式AI投入到實(shí)際應(yīng)用中
將云基礎(chǔ)設(shè)施作為AI基礎(chǔ)逐漸成為趨勢(shì)。云提供商擁有GPU資源,可幫助客戶(hù)擴(kuò)展生成式AI項(xiàng)目的規(guī)模,客戶(hù)只需按照使用量支付費(fèi)用即可。這使得企業(yè)能夠使用生成式AI進(jìn)行實(shí)驗(yàn),并在完成修補(bǔ)后關(guān)閉模型,不必在本地環(huán)境中配置GPU。這種方式不僅節(jié)省了資本支出,還為企業(yè)提供了在必要時(shí)重新進(jìn)行內(nèi)部運(yùn)行的靈活性。
所以,在決定使用云后,企業(yè)如何才能讓生成式AI項(xiàng)目走出實(shí)驗(yàn)室,并在實(shí)際應(yīng)用中為企業(yè)帶來(lái)價(jià)值呢?在這方面,可以借鑒BRIESO(構(gòu)建、完善、識(shí)別、實(shí)驗(yàn)、擴(kuò)展和優(yōu)化)模型:
構(gòu)建(Build):構(gòu)建現(xiàn)代數(shù)據(jù)架構(gòu)和通用企業(yè)數(shù)據(jù)網(wǎng)格。無(wú)論是在本地還是在云中,這種構(gòu)建都將幫助企業(yè)獲得對(duì)數(shù)據(jù)的可見(jiàn)性和控制權(quán)。而且,這還有助于企業(yè)建立一個(gè)統(tǒng)一本體,用于映射、保護(hù)和實(shí)現(xiàn)所有數(shù)據(jù)孤島合規(guī)性。所以,企業(yè)應(yīng)尋找不僅能夠滿(mǎn)足當(dāng)前需求,而且能夠根據(jù)未來(lái)增長(zhǎng)進(jìn)行擴(kuò)展的工具。通常情況下,開(kāi)源解決方案最為靈活。
完善(Refine):根據(jù)當(dāng)前業(yè)務(wù)需求完善和優(yōu)化數(shù)據(jù)。在這一階段,盡可能準(zhǔn)確預(yù)測(cè)未來(lái)需求非常重要,這將減少遷移過(guò)多非必要數(shù)據(jù)的可能性,這些數(shù)據(jù)不會(huì)帶來(lái)任何價(jià)值,還會(huì)大幅增加項(xiàng)目成本。
識(shí)別(Identify):尋找將云用于特定工作負(fù)載的機(jī)會(huì)。工作負(fù)載分析將幫助企業(yè)確定在哪些方面可以產(chǎn)生最大價(jià)值。這個(gè)階段的關(guān)鍵在于通過(guò)打通各個(gè)位置(無(wú)論是本地還是多個(gè)云)的數(shù)據(jù)來(lái)優(yōu)化項(xiàng)目。這時(shí)也是考慮潛在開(kāi)發(fā)用例的好時(shí)機(jī)。
實(shí)驗(yàn)(Experiment):嘗試使用預(yù)構(gòu)建的第三方生成式AI框架,找到最符合業(yè)務(wù)需求的框架??晒┻x擇的框架很多,例如AWS的Bedrock(Hugging Face)、Azure的OpenAI(ChatGPT)和谷歌的AI Platform(Vertex)。重要的是不要過(guò)早做出決定。為提高項(xiàng)目成功的可能性,模型必須與現(xiàn)有企業(yè)數(shù)據(jù)緊密結(jié)合。
擴(kuò)展和優(yōu)化(Scale and Optimise):在選擇了合適的平臺(tái)后,就可以考慮選擇一到兩個(gè)用例擴(kuò)展為生產(chǎn)模型。企業(yè)應(yīng)持續(xù)優(yōu)化流程,但也要密切關(guān)注與GPU相關(guān)的成本,以防成本大幅提高。當(dāng)企業(yè)的生成式AI應(yīng)用能力開(kāi)始提高時(shí),應(yīng)尋找進(jìn)一步優(yōu)化其使用的方法。靈活的AI平臺(tái)是保證長(zhǎng)期成功的關(guān)鍵。
未來(lái)近在眼前
IT和企業(yè)領(lǐng)導(dǎo)人對(duì)生成式AI應(yīng)用的變革潛力感到興奮是可以理解的。全球98%的高管認(rèn)為AI基礎(chǔ)模型將在諸如在改進(jìn)客戶(hù)服務(wù)方面,或是在實(shí)現(xiàn)無(wú)縫銜接的供應(yīng)鏈管理和大幅加強(qiáng)開(kāi)發(fā)運(yùn)維方面,在未來(lái)3-5年戰(zhàn)略中發(fā)揮重要作用。
企業(yè)仍然需要做很多工作。任何AI項(xiàng)目要想取得成功,就必須以現(xiàn)代數(shù)據(jù)架構(gòu)為起點(diǎn),然后進(jìn)行完善、識(shí)別、實(shí)驗(yàn)、擴(kuò)展和優(yōu)化。企業(yè)可以利用生成式AI取得成功的未來(lái)已指日可待。