6月19日,騰訊云行業(yè)大模型及智能應(yīng)用技術(shù)峰會在京召開,騰訊集團高級執(zhí)行副總裁、云與智慧產(chǎn)業(yè)事業(yè)群CEO湯道生在會上發(fā)布了騰訊云MaaS(Model as a Service,模型即服務(wù))服務(wù)解決方案,并詮釋了騰訊對于MaaS的理解。
記者在峰會現(xiàn)場了解到,騰訊云將基于騰訊TI平臺打造行業(yè)精選模型商店,覆蓋金融文旅、政務(wù)、傳媒教育等十大行業(yè),提供超過50個解決方案。在這些能力模型的基礎(chǔ)上,企業(yè)用戶只需要加入自己獨有的場景數(shù)據(jù),就可以快速生成專屬模型。
行業(yè)大模型仍需針對性“錘煉”
過去半年,整個產(chǎn)業(yè)界都在為大語言模型的發(fā)展感到興奮?;诖罅康闹R與公開信息的訓(xùn)練,大模型已經(jīng)能夠?qū)Σ煌I(lǐng)域的提問生成人性化的回復(fù),能夠更連貫的與用戶進(jìn)行交互式對話。越來越多的企業(yè)管理者正在思考如何把大模型技術(shù)應(yīng)用到自己的業(yè)務(wù)場景中,更好地為企業(yè)經(jīng)營管理帶來降本增效。
然而,“在具體的企業(yè)場景中,通用大模型可能還不能滿足很多企業(yè)需求,比如它不一定懂行業(yè)的專業(yè)術(shù)語,也不了解企業(yè)內(nèi)部獨特的情況,回答會比較虛或者比較籠統(tǒng),信息也不夠及時?!睖郎赋?,“大家既期待能力越來越強大的通用大模型,同時也在思考如何在使用大模型的同時保護企業(yè)數(shù)據(jù)產(chǎn)權(quán)與隱私,如何降低大模型的使用成本,這些都是企業(yè)要考慮的現(xiàn)實問題。”
以基于通用大語言模型的聊天機器人為例,它不一定是大模型唯一的服務(wù)方式,也不一定是滿足行業(yè)場景需求的最優(yōu)解?;趶V泛的公開文獻(xiàn)、網(wǎng)絡(luò)信息去訓(xùn)練大模型存在一定風(fēng)險。網(wǎng)絡(luò)信息可能會有錯誤、有謠言,甚至有偏見,許多專業(yè)的知識與行業(yè)數(shù)據(jù)的積累不足,會導(dǎo)致模型的行業(yè)針對性與精準(zhǔn)度不夠,數(shù)據(jù)噪音過大。然而,在很多的產(chǎn)業(yè)場景中,用戶對于企業(yè)所提供的專業(yè)服務(wù)要求高,容錯性低,一旦企業(yè)提供了錯誤信息,可能會引起不可避免的法律責(zé)任與公關(guān)危機。
“企業(yè)使用的大模型必須可控、可追溯、可修正,而且必須要反復(fù)與充分測試,才能上線。我們認(rèn)為客戶需要在具備行業(yè)針對性的行業(yè)大模型上,加上企業(yè)自身的數(shù)據(jù)去做訓(xùn)練和精調(diào),才能夠打造出實用性更高的智能服務(wù)大模型。”湯道生表示。他認(rèn)為,企業(yè)所需要的是在實際的場景中真正解決某個問題,而不是在一百個場景中解決百分之七十到八十的問題。
以文旅大模型為例,基于文旅大模型打造的機器人客服,可自動判斷用戶的意圖,并自主調(diào)用相應(yīng)的 API高質(zhì)量地完成用戶咨詢服務(wù)。如用戶提問“節(jié)假日有哪些比較經(jīng)濟的旅游景點可以推薦”,基于通用大模型的客服機器人只能給出一些簡單的景點介紹與路線規(guī)劃。而通過大量有針對性的行業(yè)數(shù)據(jù)所訓(xùn)練出來的行業(yè)大模型,則可以通過模型精調(diào),讓客服機器人的回答更為細(xì)致,可規(guī)劃出每天的交通景點安排,給出經(jīng)濟實惠的定制化推薦方案。
在數(shù)據(jù)與成本之間需要尋找平衡點
眾所周知,模型的訓(xùn)練數(shù)據(jù)越多,模型越大,訓(xùn)練和推理的成本也越高。實際上,大部分企業(yè)場景需求可能并不需要通用人工智能來滿足。因此,如何在合理的成本下選擇合適的模型是企業(yè)用戶真正需要去思考與決策的地方。
“數(shù)據(jù)是大模型的原材料,針對具體場景,相關(guān)數(shù)據(jù)的覆蓋與質(zhì)量都是至關(guān)重要。標(biāo)注數(shù)據(jù)的管理也是模型迭代中非常重要的工作。模型最終要在真實的場景落地,要達(dá)到理想的服務(wù)效果,往往需要把企業(yè)自身的數(shù)據(jù)也用起來。在模型研發(fā)的過程中,既要關(guān)注敏感數(shù)據(jù)的保護,也要關(guān)注安全合規(guī),還要管理好大量的數(shù)據(jù)與標(biāo)簽,不斷測試與迭代模型?!睖郎硎?。
據(jù)介紹,基于騰訊云IT平臺行業(yè)大模型精調(diào)解決方案,將幫助模型開發(fā)者與算法工程師一站式解決數(shù)據(jù)處理問題,高效率、高品質(zhì)、低成本地創(chuàng)建與使用大模型?!拔覀兛梢酝ㄟ^TI平臺以及模型私有化部署、全棧式管控、數(shù)據(jù)加密等方式,讓企業(yè)用戶在打造大模型、使用大模型的時候更放心?!睖郎劦馈?/p>
據(jù)悉,騰訊云攜手中央電視臺打造了央視人工智能開放平臺,重新構(gòu)建了一套傳媒專屬的數(shù)據(jù)標(biāo)簽體系,同時也研發(fā)了創(chuàng)新的標(biāo)簽權(quán)重引擎,讓數(shù)據(jù)標(biāo)簽顆粒度更細(xì)。在數(shù)據(jù)標(biāo)簽體系的支撐下,視頻編輯用自然語言就能實現(xiàn)跨模態(tài)檢索,比如輸入“居民消費力”,系統(tǒng)就可提供商場超市相關(guān)素材,再搭配智能剪輯就能快速生成視頻。
算力是模型持續(xù)運轉(zhuǎn)的基礎(chǔ)
“大模型的持續(xù)云轉(zhuǎn),需要高性能、高彈性與高穩(wěn)定的算力支撐,需要借助專業(yè)的云服務(wù)。在大模型的訓(xùn)練與使用過程中,需要大量的異構(gòu)算力來支持,同時對于網(wǎng)絡(luò)速度與穩(wěn)定性要求也非常高?!睖郎硎?。
GPU服務(wù)器比一般的服務(wù)器穩(wěn)定性更低一些,服務(wù)器運維問題的排查也會更頻繁,整體運維的難度與工作量會高很多。例如在訓(xùn)練集群中,一旦網(wǎng)絡(luò)有波動,訓(xùn)練的速度就會大受影響。只要一臺服務(wù)器過熱宕機,整個集群都可能要停下來,大模型的訓(xùn)練任務(wù)就需要重啟。這些事件會使得訓(xùn)練的時間大大增加,所以投入在大模型的成本也會變。
湯道生介紹稱,騰訊云所提供的穩(wěn)定計算高速網(wǎng)絡(luò)與專業(yè)的運維,可以為算法工程師大大減輕設(shè)備運維的壓力,讓他們把精力放在模型的構(gòu)建與算法的優(yōu)化上。同時,騰訊云打造的面向模型訓(xùn)練的新一代HCC(High-Performance Computing Cluster)高性能計算集群,整體性能比過去提升了三倍。在計算集群的硬實力以外,騰訊云還推出了更適合AI運算的軟能力——向量數(shù)據(jù)庫,能夠更高效的處理圖像,處理向量音頻、文本等非結(jié)構(gòu)化的數(shù)據(jù)。
“人工智能的發(fā)展是數(shù)據(jù)積累、算法創(chuàng)新與算力突破共同推動的,也是全球科技企業(yè)、高校、研究機構(gòu)開放共建的結(jié)果。今天我們再一次站在數(shù)字科技革命的起點上,大模型只是一個開端, AI與產(chǎn)業(yè)的融合將綻放出更有創(chuàng)造力的未來?!睖郎硎?。
據(jù)了解,截至目前,騰訊自身的企業(yè)級應(yīng)用已率先應(yīng)用了行業(yè)大模型。例如騰訊會議即將推出的覆蓋會議全流程場景的智能小助手,只需簡單的會議指令,便可協(xié)助用戶執(zhí)行會議安排、會議管控、智能總結(jié)、智能錄制等操作,提升用戶開會與信息流轉(zhuǎn)的效率。新一代騰訊企點智能客服也將基于行業(yè)模型,結(jié)合客戶業(yè)務(wù)需求進(jìn)行訓(xùn)練與精調(diào),提供更精準(zhǔn)、更詳細(xì)的回答,甚至可以調(diào)用業(yè)務(wù)系統(tǒng)數(shù)據(jù)提供實時分析。
作者丨宋婧? 編輯丨劉晶
美編丨馬利亞? 監(jiān)制丨連曉東