文心一言上線進(jìn)入倒計(jì)時(shí),對(duì)話百度AI中臺(tái)負(fù)責(zé)人。
生成式AI(AIGC)正引爆全球,各行各業(yè)的CEO和開發(fā)者們都在尋找機(jī)會(huì),搭上這趟數(shù)智化“快班車”,從而實(shí)現(xiàn)業(yè)務(wù)轉(zhuǎn)型、業(yè)績(jī)?cè)鲩L(zhǎng)。
在國(guó)內(nèi),接入百度對(duì)話機(jī)器人“文心一言”無(wú)疑成為企業(yè)進(jìn)入AIGC賽道“掘金”的一張入場(chǎng)券。根據(jù)官方數(shù)據(jù),已有超400家企業(yè)宣布接入文心一言,覆蓋消費(fèi)、工業(yè)、旅游、傳媒等各個(gè)領(lǐng)域。
無(wú)論是讓文心一言做搜索引擎的“大腦”,還是基于其開發(fā)智能媒體小編、智能家居助手、電商金牌客服等應(yīng)用……我們看到,AI不僅在口口相傳中名氣大漲,也在這一過(guò)程中變得更加規(guī)?;⑵矫窕?、普惠化。
百度創(chuàng)始人兼董事長(zhǎng)李彥宏在近日的內(nèi)部信中說(shuō):“AI技術(shù)已經(jīng)發(fā)展到一個(gè)臨界點(diǎn),各行各業(yè)都不可避免地被改變,中國(guó)AI市場(chǎng)即將迎來(lái)爆發(fā)性的需求增長(zhǎng)。”
在生成式AI爆發(fā)的前夕,企業(yè)接入文心一言這樣的應(yīng)用,無(wú)疑意味著其搭上了通往數(shù)智化高地的“快班車”。但這顯然只是“長(zhǎng)征”的第一步。如何讓AI技術(shù)真正跨越工程化鴻溝,飛躍AI落地的“最后一公里”?這是各行各業(yè)的CEO和開發(fā)人員眼下關(guān)注的問(wèn)題,因?yàn)檫^(guò)去幾年AI工程化確實(shí)經(jīng)歷了不少挫折。
近日,通過(guò)對(duì)話百度AI中臺(tái)的三位資深專家,智東西對(duì)這一問(wèn)題進(jìn)行了深入探討。百度AI中臺(tái),簡(jiǎn)單說(shuō)是百度智能云旗下的AI開發(fā)PaaS(平臺(tái)即服務(wù))平臺(tái),后續(xù)將推動(dòng)文心一言大規(guī)模產(chǎn)業(yè)落地,面向企業(yè)提供一系列AI開發(fā)和運(yùn)維工具。
400+企業(yè)接入文心一言有多少能抵達(dá)“最后一公里”?
根據(jù)官方消息,百度文心一言將在3月16日正式推出。屆時(shí),百度多項(xiàng)主流業(yè)務(wù)將接入文心一言,包括百度搜索,以及基于百度智能云的智能語(yǔ)音助手小度、智能駕駛阿波羅(Apollo)等;同時(shí),目前已有超400家企業(yè)宣布加入文心一言生態(tài)圈,享用這一服務(wù)。
從AI產(chǎn)業(yè)落地的流程來(lái)看,接入文心一言或許只是一個(gè)開始。
要實(shí)現(xiàn)技術(shù)到產(chǎn)品的“最后一公里”飛躍并不容易,AI開發(fā)工程化尤為重要。如果把AI模型比成一個(gè)汽車發(fā)動(dòng)機(jī),AI工程化就好比將一臺(tái)發(fā)動(dòng)機(jī)裝配成一輛可自如行駛的汽車的過(guò)程。
百度AI中臺(tái)相關(guān)負(fù)責(zé)人告訴智東西,在過(guò)去很長(zhǎng)時(shí)間里,AI工程化面臨以下幾個(gè)顯著問(wèn)題:
1、AI開發(fā)流程長(zhǎng)且復(fù)雜,行業(yè)缺乏規(guī)范。AI開發(fā)流程大致包括:數(shù)據(jù)采集和標(biāo)注、模型訓(xùn)練、應(yīng)用部署、數(shù)據(jù)回流和模型觀察,沒(méi)有規(guī)范意味著混亂無(wú)序。
2、市面上眾多AI工具使用門檻高。AI模型面對(duì)碎片化場(chǎng)景會(huì)效果衰減,企業(yè)需要做二次開發(fā),但市面上的AI開發(fā)工具不是不好用,就是不符合需求。
3、客戶基礎(chǔ)設(shè)施不完善、內(nèi)部孤島嚴(yán)重、人才短缺。比如某銀行客戶各部門建立的17個(gè)云系統(tǒng),同時(shí)各部門孤島嚴(yán)重、需求難以聚合,加之缺乏專業(yè)AI人才,眾多因素使得花大成本購(gòu)入的AI技術(shù)成為爛尾工程。
為了應(yīng)對(duì)這些AI工程化難題,整套百度AI中臺(tái)的價(jià)值在文心一言的落地中凸顯了出來(lái)。
來(lái)說(shuō),百度AI中臺(tái)是一個(gè)助力企業(yè)AI模型開發(fā)和運(yùn)維的PaaS平臺(tái)。其面向金融、能源、互聯(lián)網(wǎng)、教育等多行業(yè)提供人臉識(shí)別、OCR、圖像、AR、自然語(yǔ)言處理等多種AI能力(文心一言是其中一項(xiàng)AI服務(wù)),并幫助其實(shí)現(xiàn)簡(jiǎn)單、快速部署和驗(yàn)證。
百度AI中臺(tái)相關(guān)負(fù)責(zé)人告訴智東西,一方面,文心一言本身的數(shù)據(jù)準(zhǔn)備、標(biāo)注、模型訓(xùn)練、應(yīng)用評(píng)估等開發(fā)過(guò)程,都是基于百度AI中臺(tái)完成。另一方面用途可能更受企業(yè)關(guān)注,那就是助力文心一言的應(yīng)用開發(fā)。
具體來(lái)說(shuō),在文心一言相關(guān)模型開發(fā)過(guò)程中,百度AI中臺(tái)可提供從數(shù)據(jù)模型評(píng)估、推理優(yōu)化、數(shù)據(jù)回流等全生命周期開發(fā)工具,以保證模型訓(xùn)練效果。比如:在數(shù)據(jù)標(biāo)注環(huán)節(jié),百度AI中臺(tái)提供智能標(biāo)注方式和標(biāo)注標(biāo)準(zhǔn),最高可使成本降低70%;在算力消耗方面,百度AI中臺(tái)能依照規(guī)范提高GPU利用率,能提升資源利用率40%~80%。
總的來(lái)說(shuō),有了AI中臺(tái)中一整套工具鏈,企業(yè)將能更好地飛躍產(chǎn)品落地的“最后一公里”,從而實(shí)現(xiàn)AI投入變現(xiàn)。
生成式AI爆發(fā)前夕產(chǎn)業(yè)呼喚更適合跑AI的云
眾所周知,算法、算力和數(shù)據(jù)是AI落地的三大要素。
當(dāng)下,基于大模型的AIGC正進(jìn)入爆發(fā)前夜,新的海量智能算力需求也隨之產(chǎn)生。知名調(diào)查機(jī)構(gòu)IDC預(yù)測(cè),人工智能產(chǎn)業(yè)的軟件、硬件和服務(wù)有望在2023年突破5000億美元大關(guān)。智能算力成為產(chǎn)業(yè)最大增量。
百度AI中臺(tái)相關(guān)負(fù)責(zé)人告訴智東西,在這種背景下,產(chǎn)業(yè)需要“更適合跑AI的云”。
何謂“更適合跑AI的云”?該負(fù)責(zé)人解讀道,從傳統(tǒng)思路來(lái)看,云計(jì)算主要支撐企業(yè)數(shù)字化,AI契合智能化升級(jí),往往分階段完成;但現(xiàn)在,很多企業(yè)會(huì)選擇將數(shù)字化和AI化一起規(guī)劃、齊頭并進(jìn),效率會(huì)高得多——這就需要更適合跑AI的云。而隨著生成式AI爆發(fā),適合跑AI的云無(wú)疑需要支持大模型,支持更高速效的訓(xùn)練和推理,需要更好的異構(gòu)算力支持。
這位負(fù)責(zé)人稱,百度AI大底座正是提供了這樣的新型AI基礎(chǔ)設(shè)施。
簡(jiǎn)單來(lái)說(shuō),百度AI大底座是集百度十年AI研發(fā)之大成的“全棧自研的AI基礎(chǔ)設(shè)施”。百度AI大底座將AI生產(chǎn)全要素,包括自研芯片、大模型、深度學(xué)習(xí)框架、AI應(yīng)用集于一身,并可面向企業(yè)真實(shí)業(yè)務(wù)場(chǎng)景進(jìn)行端到端的全流程調(diào)優(yōu)。
縱觀人工智能產(chǎn)業(yè),我們看到當(dāng)下市面上實(shí)際上已經(jīng)出現(xiàn)了“AI大裝置”等同類產(chǎn)品。但就像“發(fā)動(dòng)機(jī)”有很多車企造,每一家的質(zhì)量水平有所區(qū)別一樣,百度AI中臺(tái)負(fù)責(zé)人告訴智東西,百度AI大底座相比同行競(jìng)品的一大特征就是:“全要素”和“端到端”。
▲百度AI大底座架構(gòu)圖
具體來(lái)看,百度AI大底座由前文提到的AI中臺(tái)、底層百舸異構(gòu)計(jì)算平臺(tái)兩部分構(gòu)成。百度AI中臺(tái)是用戶“界面”,文心大模型是其中可調(diào)用的一個(gè)關(guān)鍵模型PaaS服務(wù)。百舸異構(gòu)計(jì)算平臺(tái)是底層基礎(chǔ)設(shè)施服務(wù)平臺(tái),通過(guò)自研芯片、計(jì)算、存儲(chǔ)、加速等多方面技術(shù)提供加速算力IaaS(基礎(chǔ)設(shè)施即服務(wù))服務(wù)。
▲百度AI大底座產(chǎn)品圖譜
這位負(fù)責(zé)人指出,這種端到端的能力十分關(guān)鍵。比如有些企業(yè)可能買了最好的AI模型,但由于在開發(fā)中缺乏對(duì)數(shù)據(jù)的標(biāo)注和結(jié)果監(jiān)控,就導(dǎo)致AI應(yīng)用中間斷層,久而久之AI模型就被閑置了。舉個(gè)具體案例,比如某銀行在布局OCR技術(shù)中,曾就有旗下七八個(gè)部門采購(gòu)了不同廠商的產(chǎn)品,并不會(huì)考慮數(shù)據(jù)回流等全鏈條問(wèn)題,就導(dǎo)致整體效果大打折扣。
可以看到,基于AI大底座,百度一定程度上建立了在生成式AI爆發(fā)前夕的技術(shù)優(yōu)勢(shì)。根據(jù)IDC數(shù)據(jù),百度智能云已連續(xù)四年居AI公有云市場(chǎng)第一。而這種先發(fā)優(yōu)勢(shì),很有可能在AI大模型時(shí)代保持疊層效果。
AI走向平民化,百度要打造人人能用的AI開發(fā)平臺(tái)
生成式AI的爆發(fā)也意味著AI進(jìn)一步走向“平民化”。
這種核心價(jià)值層面的升維,不僅大大提升了AI的知名度,實(shí)際上也對(duì)AI開發(fā)工具提出了更加深刻的要求。
具體來(lái)說(shuō),大模型本身就幫企業(yè)簡(jiǎn)化了AI工程化流程,企業(yè)只需結(jié)合業(yè)務(wù)具體場(chǎng)景進(jìn)行小樣本調(diào)優(yōu)就能獲得所需應(yīng)用。
但與此同時(shí),承載了“平民化”期待的生成式AI,需要在工程化中延續(xù)這一“普惠”價(jià)值。新的問(wèn)題就出現(xiàn)了:大模型擁有巨量參數(shù),一次調(diào)優(yōu)涉及的資源消耗依然可觀;同時(shí)這類技術(shù)往往進(jìn)入企業(yè)業(yè)務(wù)核心,帶來(lái)更高價(jià)值的同時(shí),一旦出問(wèn)題后果會(huì)更嚴(yán)重。
因此要實(shí)現(xiàn)真正的AI平民化,一整套高效易用的AI規(guī)范與標(biāo)準(zhǔn)、工具平臺(tái)尤為重要,而這需要產(chǎn)學(xué)研多方力量共同努力。
面向AI普惠發(fā)展訴求,百度已積極參與行動(dòng)。2022年底,為了引導(dǎo)產(chǎn)業(yè)有序發(fā)展,中國(guó)信息通信研究院聯(lián)合百度、阿里、華為、“AI四小龍”等幾十家優(yōu)秀企業(yè)編制了MLOps系列標(biāo)準(zhǔn)。MLOps(Machine Learning Operations),簡(jiǎn)單來(lái)說(shuō),是指AI開發(fā)與運(yùn)維的全流程。信通院MLOps標(biāo)準(zhǔn)則可以理解為一本匯集AI開發(fā)全流程的最佳實(shí)踐“寶典”,其誕生標(biāo)志國(guó)內(nèi)AI開發(fā)從混亂無(wú)序走向標(biāo)準(zhǔn)統(tǒng)一,將大幅提升AI開發(fā)質(zhì)量和效率。
在這一背景下,百度AI中臺(tái)已首批通過(guò)信通院MLOps系列標(biāo)準(zhǔn),意味著其能夠讓企業(yè)獲得最專業(yè)的AI開發(fā)服務(wù),以業(yè)界較低的成本開發(fā)出需要的AI應(yīng)用。換句話說(shuō),MLOps標(biāo)準(zhǔn)提供了一套AI軟件項(xiàng)目研發(fā)和運(yùn)營(yíng)的方法論,百度AI中臺(tái)則為企業(yè)提供了對(duì)應(yīng)方法論的“絕佳工具”。
百度AI中臺(tái)相關(guān)負(fù)責(zé)人說(shuō),百度智能云企業(yè)AI開發(fā)平臺(tái)的整體能力在需求管理、數(shù)據(jù)工程和模型開發(fā)三個(gè)模塊均達(dá)到了旗艦級(jí)水平。
在功能上,百度AI中臺(tái)具有完善的需求和代碼管理流程,AI模型生產(chǎn)過(guò)程具備可視化建模、自動(dòng)化建模、作業(yè)建模、工作流等建模方式,對(duì)底層計(jì)算資源具有完備高效的管理模式,對(duì)模型具有全面的管理能力,對(duì)數(shù)據(jù)具有功能豐富的管理平臺(tái)和質(zhì)檢能力。
在服務(wù)過(guò)程上,百度AI中臺(tái)從組織結(jié)構(gòu)到流程管理,再到管理工具方面,均具有較高的服務(wù)水平,能夠?yàn)橥獠科髽I(yè)客戶的需求提供較為快速和較高質(zhì)量的響應(yīng)。
百度AI中臺(tái)相關(guān)負(fù)責(zé)人告訴智東西,在AI基礎(chǔ)設(shè)施能力獲得權(quán)威認(rèn)證背后,AI普惠實(shí)際上是百度智能云長(zhǎng)期以來(lái)的一大核心價(jià)值。
這不是一蹴而就的。他回顧道,2016年,百度發(fā)布了國(guó)內(nèi)第一個(gè)深度學(xué)習(xí)框架——飛槳,隨之百度內(nèi)部開始“賽馬”做多個(gè)機(jī)器學(xué)習(xí)平臺(tái)。2018年,高級(jí)開發(fā)能力的BML、低門檻開發(fā)的EasyDL、以及用戶實(shí)訓(xùn)比賽社區(qū)的AI Studio三大平臺(tái)脫穎而出。
“分久必合,合久必分”。2020年百度將這三大平臺(tái)整合,并按照MLOps的過(guò)程將業(yè)務(wù)劃分為樣本數(shù)據(jù)中心、開發(fā)中心、模型中心和服務(wù)運(yùn)行平臺(tái)四大階段板塊,基本涵蓋了人工智能開發(fā)運(yùn)維的全生命周期。通過(guò)2021~2022年的一年三到四次迭代,這一平臺(tái)最終實(shí)現(xiàn)了AI開發(fā)低門檻目標(biāo)。
可以看到,通過(guò)八年內(nèi)部賽馬打造百度AI中臺(tái),百度正將其“反饋驅(qū)動(dòng)創(chuàng)新”的科學(xué)方法論賦能給企業(yè),更將其AI普惠價(jià)值傳達(dá)給行業(yè)。
結(jié)語(yǔ):生成式AI風(fēng)起云智一體趨勢(shì)凸顯
當(dāng)下,我國(guó)人工智能產(chǎn)業(yè)在經(jīng)歷了十幾年波峰波谷之后,正乘著生成式AI技術(shù)的東風(fēng)迎來(lái)新的春天。憑借技術(shù)屬性和社會(huì)人才等各方面條件,AI技術(shù)落地的廣度深度延展,正走向規(guī)模化、平民化、普惠化。
從企業(yè)角度來(lái)看,他們正通過(guò)接入文心一言等產(chǎn)品的方式,實(shí)現(xiàn)數(shù)字化與智能化轉(zhuǎn)型的齊頭并進(jìn)。盡管正如科技部部長(zhǎng)在兩會(huì)“部長(zhǎng)通道”中所說(shuō),國(guó)產(chǎn)力量與OpenAI等國(guó)際公司仍存在差距。但百度文心一言無(wú)疑是國(guó)內(nèi)企業(yè)吃到AI技術(shù)新紅利的一條“快車道”入口。
與此同時(shí),企業(yè)接入大平臺(tái)大模型也只是一個(gè)開始。下一步,如何基于AI大模型進(jìn)行二次開發(fā)、數(shù)據(jù)挖掘、優(yōu)化調(diào)優(yōu)及部署測(cè)試,讓AI實(shí)現(xiàn)“最后一公里”飛躍,成為更關(guān)鍵的問(wèn)題。
這也使我們?cè)絹?lái)越意識(shí)到,AI落地是一條算法、算力和數(shù)據(jù)跨越漫長(zhǎng)開發(fā)鏈條的握手合作。產(chǎn)業(yè)呼喚更適合跑AI的云,云智一體也成為云計(jì)算產(chǎn)業(yè)發(fā)展的重要趨勢(shì)。
作者 | 李水青
編輯 | 漠影