6月19日,騰訊云行業(yè)大模型及智能應(yīng)用技術(shù)峰會(huì)在京召開,騰訊集團(tuán)高級(jí)執(zhí)行副總裁、云與智慧產(chǎn)業(yè)事業(yè)群CEO湯道生在會(huì)上發(fā)布了騰訊云MaaS(Model as a Service,模型即服務(wù))服務(wù)解決方案,并詮釋了騰訊對(duì)于MaaS的理解。
記者在峰會(huì)現(xiàn)場(chǎng)了解到,騰訊云將基于騰訊TI平臺(tái)打造行業(yè)精選模型商店,覆蓋金融文旅、政務(wù)、傳媒教育等十大行業(yè),提供超過50個(gè)解決方案。在這些能力模型的基礎(chǔ)上,企業(yè)用戶只需要加入自己獨(dú)有的場(chǎng)景數(shù)據(jù),就可以快速生成專屬模型。
行業(yè)大模型仍需針對(duì)性“錘煉”
過去半年,整個(gè)產(chǎn)業(yè)界都在為大語言模型的發(fā)展感到興奮。基于大量的知識(shí)與公開信息的訓(xùn)練,大模型已經(jīng)能夠?qū)Σ煌I(lǐng)域的提問生成人性化的回復(fù),能夠更連貫的與用戶進(jìn)行交互式對(duì)話。越來越多的企業(yè)管理者正在思考如何把大模型技術(shù)應(yīng)用到自己的業(yè)務(wù)場(chǎng)景中,更好地為企業(yè)經(jīng)營(yíng)管理帶來降本增效。
然而,“在具體的企業(yè)場(chǎng)景中,通用大模型可能還不能滿足很多企業(yè)需求,比如它不一定懂行業(yè)的專業(yè)術(shù)語,也不了解企業(yè)內(nèi)部獨(dú)特的情況,回答會(huì)比較虛或者比較籠統(tǒng),信息也不夠及時(shí)。”湯道生指出,“大家既期待能力越來越強(qiáng)大的通用大模型,同時(shí)也在思考如何在使用大模型的同時(shí)保護(hù)企業(yè)數(shù)據(jù)產(chǎn)權(quán)與隱私,如何降低大模型的使用成本,這些都是企業(yè)要考慮的現(xiàn)實(shí)問題。”
以基于通用大語言模型的聊天機(jī)器人為例,它不一定是大模型唯一的服務(wù)方式,也不一定是滿足行業(yè)場(chǎng)景需求的最優(yōu)解?;趶V泛的公開文獻(xiàn)、網(wǎng)絡(luò)信息去訓(xùn)練大模型存在一定風(fēng)險(xiǎn)。網(wǎng)絡(luò)信息可能會(huì)有錯(cuò)誤、有謠言,甚至有偏見,許多專業(yè)的知識(shí)與行業(yè)數(shù)據(jù)的積累不足,會(huì)導(dǎo)致模型的行業(yè)針對(duì)性與精準(zhǔn)度不夠,數(shù)據(jù)噪音過大。然而,在很多的產(chǎn)業(yè)場(chǎng)景中,用戶對(duì)于企業(yè)所提供的專業(yè)服務(wù)要求高,容錯(cuò)性低,一旦企業(yè)提供了錯(cuò)誤信息,可能會(huì)引起不可避免的法律責(zé)任與公關(guān)危機(jī)。
“企業(yè)使用的大模型必須可控、可追溯、可修正,而且必須要反復(fù)與充分測(cè)試,才能上線。我們認(rèn)為客戶需要在具備行業(yè)針對(duì)性的行業(yè)大模型上,加上企業(yè)自身的數(shù)據(jù)去做訓(xùn)練和精調(diào),才能夠打造出實(shí)用性更高的智能服務(wù)大模型?!睖郎硎?。他認(rèn)為,企業(yè)所需要的是在實(shí)際的場(chǎng)景中真正解決某個(gè)問題,而不是在一百個(gè)場(chǎng)景中解決百分之七十到八十的問題。
以文旅大模型為例,基于文旅大模型打造的機(jī)器人客服,可自動(dòng)判斷用戶的意圖,并自主調(diào)用相應(yīng)的 API高質(zhì)量地完成用戶咨詢服務(wù)。如用戶提問“節(jié)假日有哪些比較經(jīng)濟(jì)的旅游景點(diǎn)可以推薦”,基于通用大模型的客服機(jī)器人只能給出一些簡(jiǎn)單的景點(diǎn)介紹與路線規(guī)劃。而通過大量有針對(duì)性的行業(yè)數(shù)據(jù)所訓(xùn)練出來的行業(yè)大模型,則可以通過模型精調(diào),讓客服機(jī)器人的回答更為細(xì)致,可規(guī)劃出每天的交通景點(diǎn)安排,給出經(jīng)濟(jì)實(shí)惠的定制化推薦方案。
在數(shù)據(jù)與成本之間需要尋找平衡點(diǎn)
眾所周知,模型的訓(xùn)練數(shù)據(jù)越多,模型越大,訓(xùn)練和推理的成本也越高。實(shí)際上,大部分企業(yè)場(chǎng)景需求可能并不需要通用人工智能來滿足。因此,如何在合理的成本下選擇合適的模型是企業(yè)用戶真正需要去思考與決策的地方。
“數(shù)據(jù)是大模型的原材料,針對(duì)具體場(chǎng)景,相關(guān)數(shù)據(jù)的覆蓋與質(zhì)量都是至關(guān)重要。標(biāo)注數(shù)據(jù)的管理也是模型迭代中非常重要的工作。模型最終要在真實(shí)的場(chǎng)景落地,要達(dá)到理想的服務(wù)效果,往往需要把企業(yè)自身的數(shù)據(jù)也用起來。在模型研發(fā)的過程中,既要關(guān)注敏感數(shù)據(jù)的保護(hù),也要關(guān)注安全合規(guī),還要管理好大量的數(shù)據(jù)與標(biāo)簽,不斷測(cè)試與迭代模型。”湯道生表示。
據(jù)介紹,基于騰訊云IT平臺(tái)行業(yè)大模型精調(diào)解決方案,將幫助模型開發(fā)者與算法工程師一站式解決數(shù)據(jù)處理問題,高效率、高品質(zhì)、低成本地創(chuàng)建與使用大模型。“我們可以通過TI平臺(tái)以及模型私有化部署、全棧式管控、數(shù)據(jù)加密等方式,讓企業(yè)用戶在打造大模型、使用大模型的時(shí)候更放心?!睖郎劦馈?/p>
據(jù)悉,騰訊云攜手中央電視臺(tái)打造了央視人工智能開放平臺(tái),重新構(gòu)建了一套傳媒專屬的數(shù)據(jù)標(biāo)簽體系,同時(shí)也研發(fā)了創(chuàng)新的標(biāo)簽權(quán)重引擎,讓數(shù)據(jù)標(biāo)簽顆粒度更細(xì)。在數(shù)據(jù)標(biāo)簽體系的支撐下,視頻編輯用自然語言就能實(shí)現(xiàn)跨模態(tài)檢索,比如輸入“居民消費(fèi)力”,系統(tǒng)就可提供商場(chǎng)超市相關(guān)素材,再搭配智能剪輯就能快速生成視頻。
算力是模型持續(xù)運(yùn)轉(zhuǎn)的基礎(chǔ)
“大模型的持續(xù)云轉(zhuǎn),需要高性能、高彈性與高穩(wěn)定的算力支撐,需要借助專業(yè)的云服務(wù)。在大模型的訓(xùn)練與使用過程中,需要大量的異構(gòu)算力來支持,同時(shí)對(duì)于網(wǎng)絡(luò)速度與穩(wěn)定性要求也非常高?!睖郎硎?。
GPU服務(wù)器比一般的服務(wù)器穩(wěn)定性更低一些,服務(wù)器運(yùn)維問題的排查也會(huì)更頻繁,整體運(yùn)維的難度與工作量會(huì)高很多。例如在訓(xùn)練集群中,一旦網(wǎng)絡(luò)有波動(dòng),訓(xùn)練的速度就會(huì)大受影響。只要一臺(tái)服務(wù)器過熱宕機(jī),整個(gè)集群都可能要停下來,大模型的訓(xùn)練任務(wù)就需要重啟。這些事件會(huì)使得訓(xùn)練的時(shí)間大大增加,所以投入在大模型的成本也會(huì)變。
湯道生介紹稱,騰訊云所提供的穩(wěn)定計(jì)算高速網(wǎng)絡(luò)與專業(yè)的運(yùn)維,可以為算法工程師大大減輕設(shè)備運(yùn)維的壓力,讓他們把精力放在模型的構(gòu)建與算法的優(yōu)化上。同時(shí),騰訊云打造的面向模型訓(xùn)練的新一代HCC(High-Performance Computing Cluster)高性能計(jì)算集群,整體性能比過去提升了三倍。在計(jì)算集群的硬實(shí)力以外,騰訊云還推出了更適合AI運(yùn)算的軟能力——向量數(shù)據(jù)庫,能夠更高效的處理圖像,處理向量音頻、文本等非結(jié)構(gòu)化的數(shù)據(jù)。
“人工智能的發(fā)展是數(shù)據(jù)積累、算法創(chuàng)新與算力突破共同推動(dòng)的,也是全球科技企業(yè)、高校、研究機(jī)構(gòu)開放共建的結(jié)果。今天我們?cè)僖淮握驹跀?shù)字科技革命的起點(diǎn)上,大模型只是一個(gè)開端, AI與產(chǎn)業(yè)的融合將綻放出更有創(chuàng)造力的未來?!睖郎硎?。
據(jù)了解,截至目前,騰訊自身的企業(yè)級(jí)應(yīng)用已率先應(yīng)用了行業(yè)大模型。例如騰訊會(huì)議即將推出的覆蓋會(huì)議全流程場(chǎng)景的智能小助手,只需簡(jiǎn)單的會(huì)議指令,便可協(xié)助用戶執(zhí)行會(huì)議安排、會(huì)議管控、智能總結(jié)、智能錄制等操作,提升用戶開會(huì)與信息流轉(zhuǎn)的效率。新一代騰訊企點(diǎn)智能客服也將基于行業(yè)模型,結(jié)合客戶業(yè)務(wù)需求進(jìn)行訓(xùn)練與精調(diào),提供更精準(zhǔn)、更詳細(xì)的回答,甚至可以調(diào)用業(yè)務(wù)系統(tǒng)數(shù)據(jù)提供實(shí)時(shí)分析。
作者丨宋婧? 編輯丨劉晶
美編丨馬利亞? 監(jiān)制丨連曉東