作者 |??李水青
編輯?|??漠影
AI產(chǎn)業(yè)焦點(diǎn)切換,對(duì)話星環(huán)科技VP透析三大新趨勢(shì)。
剛剛過去的2022年,是人工智能(AI)產(chǎn)業(yè)焦點(diǎn)快速切換的一年。紅極一時(shí)的計(jì)算機(jī)視覺、智能語音等AI算法賽道回歸冷靜,數(shù)據(jù)智能新領(lǐng)域變得更加炙手可熱。隨著2022年東數(shù)西算工程、“數(shù)據(jù)二十條”等政策推出,數(shù)據(jù)的生產(chǎn)力要素地位更加凸顯,發(fā)展大數(shù)據(jù)產(chǎn)業(yè)成為數(shù)字經(jīng)濟(jì)發(fā)展的迫切要求。知名行研機(jī)構(gòu)IDC預(yù)測(cè),2026年中國大數(shù)據(jù)IT支出規(guī)模將達(dá)359.5億美元(約合2438.13億元人民幣),復(fù)合增長率達(dá)21.4%。知名國產(chǎn)大數(shù)據(jù)基礎(chǔ)軟件公司星環(huán)科技技術(shù)VP(高管)楊一帆告訴智東西,前幾年AI企業(yè)落地以單一模態(tài)技術(shù)為主,比如以單純的圖象數(shù)據(jù)分析支持圖像識(shí)別、身份認(rèn)證等應(yīng)用。
近年隨著技術(shù)市場(chǎng)和應(yīng)用市場(chǎng)的逐漸成熟和深入,單模態(tài)、單模型難以應(yīng)對(duì)實(shí)際落地過程中復(fù)雜場(chǎng)景的需求,為數(shù)據(jù)智能的進(jìn)一步發(fā)展提供了動(dòng)力。作為人工智能三大要素之一,數(shù)據(jù)正為AI產(chǎn)業(yè)帶來新的活力。楊一帆認(rèn)為,面向新的2023年,多模態(tài)數(shù)據(jù)分析、可信AI、開發(fā)運(yùn)維一體化有望成為產(chǎn)業(yè)發(fā)展的三大新趨勢(shì)。
01.打破數(shù)據(jù)孤島,多模態(tài)數(shù)據(jù)分析興起
進(jìn)入十四五數(shù)字化轉(zhuǎn)型時(shí)期,我們看到政企行業(yè)數(shù)據(jù)的豐富程度和增長速度都很可觀,多模型、多模態(tài)數(shù)據(jù)成為AI產(chǎn)業(yè)發(fā)展的新特征。隨之而來的是嚴(yán)重的數(shù)據(jù)孤島、知識(shí)壁壘,阻礙了AI落地進(jìn)程。以智慧零售場(chǎng)景為例,當(dāng)某商場(chǎng)需要從消費(fèi)商品評(píng)價(jià)研究特定人群的消費(fèi)偏好時(shí),他們至少需要使用人群“關(guān)系”、消費(fèi)“記錄”、商品“評(píng)價(jià)”等不同來源或形式的數(shù)據(jù)進(jìn)行分析。
按照傳統(tǒng)方法,這些數(shù)據(jù)通常來自不同數(shù)據(jù)模型的數(shù)據(jù)庫,而商場(chǎng)的分析團(tuán)隊(duì)需要適配多種數(shù)據(jù)庫的連接、查詢、開發(fā)、分析技術(shù)等,不僅流程復(fù)雜、效率低下會(huì)帶來決策時(shí)效性差,而且數(shù)據(jù)不一致引起的決策誤導(dǎo)也容易出現(xiàn)。在這種背景下,一種基于統(tǒng)一架構(gòu)的多模態(tài)數(shù)據(jù)分析工具應(yīng)運(yùn)而生。面向多模態(tài)數(shù)據(jù)分析需求,星環(huán)科技多模型大數(shù)據(jù)基礎(chǔ)平臺(tái)TDH9.0(Transwarp Data Hub)提出統(tǒng)一架構(gòu):通過統(tǒng)一接口、統(tǒng)一計(jì)算引擎、統(tǒng)一分布式存儲(chǔ)管理系統(tǒng)、統(tǒng)一的資源調(diào)度,匯聚十種數(shù)據(jù)模型組合拳,打通了大數(shù)據(jù)業(yè)務(wù)全場(chǎng)景。
比如基于TDH9.0,前文提到的智慧零售數(shù)據(jù)分析難題將被解決,客戶能一舉實(shí)現(xiàn)跨三個(gè)表聯(lián)合分析,同時(shí)無需額外數(shù)據(jù)導(dǎo)出或者轉(zhuǎn)換,在準(zhǔn)確分析的同時(shí)簡(jiǎn)化開發(fā)流程和用戶操作。值得一提的是,星環(huán)科技還通過知識(shí)圖譜平臺(tái)Sophon KG加持TDH9.0,增強(qiáng)多模態(tài)數(shù)據(jù)分析的認(rèn)知智能化水平。
以金融行業(yè)為例,Sophon KG開發(fā)的圖像和自然語言處理模塊,支持從文本、圖像、關(guān)聯(lián)數(shù)據(jù)、表格數(shù)據(jù)等多種類型數(shù)據(jù)中,自動(dòng)抽取和推理行業(yè)、公司及機(jī)構(gòu)名、地址、人名、產(chǎn)品、時(shí)間等實(shí)體、關(guān)系和事件,從而通過多模態(tài)數(shù)據(jù)分析幫助相關(guān)機(jī)構(gòu)智能化識(shí)別可疑交易、發(fā)現(xiàn)黑灰產(chǎn)團(tuán)伙、畫像貸款人違約風(fēng)險(xiǎn)、預(yù)測(cè)擔(dān)保人風(fēng)險(xiǎn)等。可以看到,多模態(tài)的數(shù)據(jù)分析已成為AI產(chǎn)業(yè)落地迫切需求。它有利于企業(yè)打破數(shù)據(jù)孤島,進(jìn)而從數(shù)據(jù)這一底層生產(chǎn)要素推動(dòng)AI向認(rèn)知智能進(jìn)化,以此幫人們解決場(chǎng)景更復(fù)雜的問題。
02.提倡數(shù)據(jù)流通交易,可信AI成剛需
隨著AI落地進(jìn)入深水區(qū),AI還面臨越來越多的可信挑戰(zhàn)。比如AI模型可解釋性的缺乏限制了AI獨(dú)立應(yīng)用,系統(tǒng)如何在使用數(shù)據(jù)的同時(shí)保護(hù)用戶隱私,AI系統(tǒng)如何避免不穩(wěn)定性帶來的安全問題等,這些問題在近年來尤其凸顯,《新一代人工智能治理原則》、《人工智能算法金融應(yīng)用評(píng)價(jià)規(guī)范》《關(guān)于加強(qiáng)科技倫理治理的意見》等規(guī)范和標(biāo)準(zhǔn)相繼發(fā)布。
進(jìn)入2022年,東數(shù)西算、“數(shù)據(jù)二十條”、數(shù)據(jù)安全法及個(gè)人信息保護(hù)法等政策制度的推出,全國多家數(shù)據(jù)交易所落成,讓數(shù)據(jù)生產(chǎn)要素的地位凸顯,數(shù)據(jù)交易和應(yīng)用有望迎來規(guī)?;A段??尚?a class="article-link" target="_blank" href="/tag/AI%E6%8A%80%E6%9C%AF/">AI技術(shù),是促進(jìn)數(shù)據(jù)智能產(chǎn)業(yè)規(guī)?;那疤岷捅U?。為實(shí)現(xiàn)“數(shù)據(jù)-AI模型-業(yè)務(wù)”全鏈路的可信,星環(huán)科技提出了一種通用的可信AI治理框架T-DACM。楊一帆對(duì)智東西解讀道,這一領(lǐng)域具有“短板效應(yīng)”,任意一個(gè)數(shù)據(jù)處理環(huán)節(jié)出問題都會(huì)導(dǎo)致最終模型不可信。
為此,T-DACM框架覆蓋了AI開發(fā)應(yīng)用的全流程,從可信數(shù)據(jù)(Trusted Data)、可信算法(Trusted Algorithm)、可信計(jì)算(Trusted Computation)、可信管理(Trusted Management)四個(gè)層面,覆蓋了數(shù)據(jù)安全、模型安全、隱私保護(hù)、風(fēng)險(xiǎn)控制、過程管理、可解釋性、公平倫理、追溯追責(zé)等AI熱點(diǎn)問題的解決方法。
楊一帆談道,T-DACM框架能有效提升模型精度、解決模型黑盒問題。比如,在某銀行授信系統(tǒng)案例中,據(jù)稱該方案助其模型精度提升至99.2%,失聯(lián)用戶率降低至0.4%,并通過引入模型可解釋模塊解決了客戶評(píng)分差異無法解釋等問題。不過值得一提的是,從當(dāng)前產(chǎn)業(yè)發(fā)展進(jìn)程來看,AI模型的黑盒仍未完全解開。因此,可信AI治理發(fā)展任重道遠(yuǎn),需要產(chǎn)業(yè)繼續(xù)完善可信AI框架并在實(shí)際場(chǎng)景中迭代升級(jí)。
03.數(shù)據(jù)流水線成熟,AI開發(fā)運(yùn)維一體化
開發(fā)運(yùn)維一體化,是2022年AI行業(yè)發(fā)展的另一大趨勢(shì)。用數(shù)據(jù)科學(xué)賦能產(chǎn)業(yè),說白了,就是通過數(shù)據(jù)特征提取、AI模型構(gòu)建提供分析服務(wù),來促進(jìn)業(yè)務(wù)降本增效、提升體驗(yàn)。近年來,隨著數(shù)據(jù)和模型種類變多,散落在企業(yè)多個(gè)部門的管理和運(yùn)維成本也在變高,面臨一系列挑戰(zhàn)。對(duì)此,楊一帆認(rèn)為,面向數(shù)據(jù)科學(xué)全流水線的轉(zhuǎn)型正成為一大新趨勢(shì),數(shù)字化轉(zhuǎn)型的客戶需要開發(fā)運(yùn)維一體化。
面向AI落地,星環(huán)科技推出了企業(yè)級(jí)AI能力運(yùn)營平臺(tái)Sophon MLOps,圍繞企業(yè)AI模型接入、運(yùn)營管理、持續(xù)訓(xùn)練的全生命周期,分別提供規(guī)?;晒芾怼⒏咝P屯评?、模型監(jiān)控預(yù)警、模型性能評(píng)估、隱私安全保障等功能;同時(shí),面向大數(shù)據(jù)開發(fā),星環(huán)科技通過TDS(Transwarp Data Studio,星環(huán)大數(shù)據(jù)開發(fā)工具)提供DataOps能力;面向軟件開發(fā),星環(huán)科技通過TDC(Transwarp Data Cloud,星環(huán)數(shù)據(jù)云平臺(tái))提供DevOps和數(shù)據(jù)云服務(wù)能力。
楊一帆說,DevOps提供了一個(gè)開發(fā)集成的底座,DataOps提供了一個(gè)數(shù)據(jù)不停地集成開發(fā)的前提,MLOps進(jìn)行AI數(shù)據(jù)分析方向的持續(xù)提升的使命。通過將數(shù)據(jù)智能多個(gè)環(huán)節(jié)能力“連珠成鏈”,意味著產(chǎn)業(yè)流水線進(jìn)一步走向成熟??梢灶A(yù)測(cè),以星環(huán)科技為代表企業(yè)提出的全流程化的數(shù)據(jù)智能平臺(tái)如果深入實(shí)踐落地,有望促進(jìn)產(chǎn)業(yè)生產(chǎn)力大大釋放。
04.結(jié)語:AI落地進(jìn)入深水區(qū),數(shù)據(jù)要素重要性凸顯
數(shù)據(jù)智能成為AI落地深水區(qū)的一大新焦點(diǎn),通過對(duì)話星環(huán)科技技術(shù)VP楊一帆,我們進(jìn)一步透析了數(shù)據(jù)智能所面臨的多模態(tài)數(shù)據(jù)分析、可信AI、開發(fā)運(yùn)維一體化幾大發(fā)展趨勢(shì)。根據(jù)中國信通院最新研究數(shù)據(jù),2021年我國大數(shù)據(jù)產(chǎn)業(yè)規(guī)模達(dá)1.3萬億元。隨著數(shù)字化轉(zhuǎn)型和相關(guān)新政策推進(jìn),產(chǎn)業(yè)的大數(shù)據(jù)平臺(tái)技術(shù)也加速落地和迭代,有望促進(jìn)2023年數(shù)據(jù)智能產(chǎn)業(yè)呈現(xiàn)新突破局面。