公元2023年,“百模爭流”。從中關(guān)村到硅谷,創(chuàng)新之火,如火如荼,赤誠可鑒卻優(yōu)偽難辨。
維特根斯坦說:凡是能夠說的,都能夠說清楚;凡是不能說的,必須保持沉默。
在一重產(chǎn)業(yè)革命級(jí)別的技術(shù)范式轉(zhuǎn)折之中,識(shí)別真正的硬核創(chuàng)新者,識(shí)別大模型時(shí)代產(chǎn)業(yè)趨勢(shì),我們須摒棄能說會(huì)道的投機(jī)者,去跟隨如維特根斯坦所說的這類既可以自證又懂得沉默的盜火者。
在審讀過多數(shù)AI公司之后,在我們看來,商湯是其中更被低估的盜火者之一。直到大模型火焰點(diǎn)燃中國千行百業(yè)之后,更多的人將驟然領(lǐng)悟,它為何必然是新周期里那個(gè)中國的“普羅米修斯”式AI公司之一。
AI原生時(shí)代盜火者
蒸汽機(jī),交流電,互聯(lián)網(wǎng),每一次工業(yè)革命級(jí)技術(shù)發(fā)軔之后,平均都至少將用50年時(shí)間,劃分出一個(gè)指數(shù)級(jí)的經(jīng)濟(jì)增長時(shí)代。這其中,最重要的一重現(xiàn)象,就是新企業(yè)的進(jìn)入與老企業(yè)的退出。
圖:1980年至2010年信息技術(shù)革命黃金30年內(nèi)美國新老企業(yè)進(jìn)入與退出率。來源:《美國增長的起落》
特別是在顛覆性技術(shù)交替的5-10年內(nèi),產(chǎn)業(yè)界的新舊勢(shì)力碰撞將異常激烈。這一過程,便是新技術(shù)原生代登上歷史舞臺(tái)的窗口時(shí)刻。
通常來說,在此之后,主導(dǎo)產(chǎn)業(yè)經(jīng)濟(jì)的力量,將從屬于新技術(shù)原生時(shí)代的力量集群們。一如汽車誕生之后,馬車在社會(huì)分類消費(fèi)支出的份額之中迅速歸零(見下圖),馬車夫和車行老板們?cè)诮?jīng)濟(jì)系統(tǒng)里的榮耀,在歷經(jīng)幾個(gè)世紀(jì)的穩(wěn)態(tài)后,一朝泯滅。
圖:1869年至2013年美國部分大類耐用品在社會(huì)分類消費(fèi)支出份額中的變化。來源:《美國增長的起落》
這警示著我們,每當(dāng)新一輪技術(shù)革命肇始之際,我們務(wù)必將眼界與籌碼投向從屬于新周期的原生型公司之上,而勿要沉湎于過往的線性經(jīng)濟(jì)邏輯中——這便如:我們不能指望馬車夫和馬車行老板們?cè)斐銎囈粯印?/p>
換言之,在方興未艾的大模型時(shí)代,我們更須著眼于AI原生時(shí)代的盜火者。它們至少存在以下幾個(gè)顯著特征:
1.具備前瞻的算力思維。
2.具備智能算力工程能力。
3.具有智能算法技術(shù)池積累。
4.具備以算力、算法統(tǒng)籌千行百業(yè)不同特質(zhì)的數(shù)據(jù)之能力,并可以快速迭代設(shè)配,具有為不同產(chǎn)業(yè)至少帶來數(shù)量級(jí)效益增厚的潛力甚至能力。
這四點(diǎn)不難理解:算力(算力工程能力)是AI原生時(shí)代所有商業(yè)模式的第一性,算力思維是與互聯(lián)網(wǎng)時(shí)代流量思維最大優(yōu)先級(jí)的區(qū)別特征。算力思維同時(shí)也是算法技術(shù)的根基,驅(qū)動(dòng)著智能在通用以及專用領(lǐng)域的持續(xù)涌現(xiàn)。唯有具備軟硬一體(算力與算法的統(tǒng)一)思維能力基礎(chǔ),才能在智能革命競(jìng)爭中走得更遠(yuǎn),直至融入千行百業(yè)之中勝出。(該系列邏輯已在此前系列研究報(bào)告中,不復(fù)贅述。)
通觀海內(nèi)外AI業(yè)界,具備這四項(xiàng)能力的AI原生力量實(shí)則比我們認(rèn)為的要少很多,而來自中國的商湯則是其中之一:
1、前瞻性:最早布局AIDC人工智能超算中心的AI公司。
商湯2018年籌備落子的AIDC,于2022年正式于上海臨港投用,基于2.7萬塊GPU實(shí)現(xiàn)對(duì)外輸出算力突破5.0 exaFLOPS,可支持最多20個(gè)千億參數(shù)量超大模型并行訓(xùn)練。
某種意義上,這是中國人工智能從單一場(chǎng)景應(yīng)用正式轉(zhuǎn)向通用人工智能的標(biāo)志。在此之前,全球范圍內(nèi)規(guī)模性算力中心多以傳統(tǒng)串行計(jì)算為主、并行計(jì)算為輔。
商湯此舉意味良多——
彼得蒂爾在移動(dòng)互聯(lián)網(wǎng)時(shí)代總結(jié)道:每個(gè)通向偉大的公司都有自己的“秘密”。商湯究竟在2018年時(shí)看到了什么,因何最早敢為天下先,以數(shù)十億真金百億投向AIDC這一通用人工智能基礎(chǔ)設(shè)施,正是其得以從容不迫地穿越至AI原生時(shí)代的關(guān)鍵秘密。
關(guān)乎商業(yè)競(jìng)爭的秘密不足為外人道,但我們已能看到日日新大模型體系順?biāo)斓芈涞兀⒁蕴鞛閱挝徊粩噙M(jìn)化。更重要的是,商湯的AIDC本身已經(jīng)成為一個(gè)可以產(chǎn)生現(xiàn)金流的生意——通過并行算力的對(duì)外服務(wù),以及對(duì)產(chǎn)業(yè)的賦能,已經(jīng)使它在AI原生時(shí)代初期即手握兩個(gè)關(guān)鍵商業(yè)模式:
- 算力即服務(wù);
- 模型即服務(wù)。
比較起2023年前諸多在行業(yè)場(chǎng)景里摸爬滾打,最終卻不得不接受數(shù)以億計(jì)沉沒成本的1.0代AI公司,商湯有效地將在1.0時(shí)期募集的資金高效留存并順利地過度到了2.0時(shí)代。這是證明這家公司擁有超級(jí)AI戰(zhàn)略視角的關(guān)鍵佐證。
2、可靠性:領(lǐng)先的智算工程能力。
關(guān)于智算工程能力,商湯的可靠程度在整個(gè)中國AI大模型領(lǐng)域應(yīng)是最不容指摘的公司之一:
(1)AIDC這一萬卡(GPU)級(jí)別的智能計(jì)算中心,本身即是智算工程的產(chǎn)物。AIDC歷時(shí)數(shù)年的設(shè)計(jì)建設(shè),亦是智算工程能力進(jìn)一步磨礪的過程。
(2)以數(shù)據(jù)說話:商湯針對(duì)新大模型的自動(dòng)化數(shù)據(jù)標(biāo)注服務(wù)目前已將智能標(biāo)注效率提升百倍;大模型推理部署服務(wù)可將大模型推理效率提高600%;大模型并行訓(xùn)練服務(wù)支持單集群3200卡5000億稠密參數(shù)模型訓(xùn)練。
而這也衍生出了商湯在AI原生時(shí)代第三個(gè)關(guān)鍵商業(yè)模式:
- 工程能力即服務(wù)。
可以預(yù)期的是,隨著大模型在千行百業(yè)的不斷滲透,將衍生出海量的基于AI大模型的創(chuàng)業(yè)公司。屆時(shí),它們遠(yuǎn)不必從零到一的在大模型服務(wù)上苦思冥想,以商湯為代表的中國AGI先行者,已經(jīng)集結(jié)了算力底座-MaaS-算力工程調(diào)優(yōu)維護(hù)等全流程生產(chǎn)力平臺(tái)工具——如果說算力是水電,MaaS是房屋,那么工程能力便是物業(yè)維護(hù),全程護(hù)航中國AI原生時(shí)代的不斷進(jìn)取與突破。
3、可信性:600多篇頂級(jí)學(xué)術(shù)論文,超過12000件人工智能專利及專利申請(qǐng)積累。
根據(jù)我們的最新統(tǒng)計(jì),商湯科技自2014年成立以來,在各項(xiàng)全球競(jìng)賽中已獲得70多項(xiàng)冠軍,發(fā)表了600多篇頂級(jí)學(xué)術(shù)論文,并擁有超過12000件人工智能專利及專利申請(qǐng)。
專利與學(xué)術(shù)論文是技術(shù)的影子,它不是事實(shí)本身,卻映射事實(shí)的輪廓。透過這樣的商湯這一放之全行業(yè)亦不遑多讓的AI技術(shù)能力輪廓,我們大致可以看到:
(1)從所謂AI四小龍之一,到AIDC戰(zhàn)略的落地,再到最先穿越至AI原生時(shí)代,以及更高效率地落地日日新大模型,AI工程能力逐日擢升,商湯AI技術(shù)能力的演進(jìn)并最終脫穎而出,是一個(gè)一步一個(gè)腳印、可逐幀回溯的過程,具有充分的可信性。
(2)商湯從單一場(chǎng)景通向通用原生時(shí)代,整個(gè)過程中投向研發(fā)的錢,都以技術(shù)為載體實(shí)現(xiàn)了逐一落地,并也因此高效地全程支撐了其超級(jí)AI戰(zhàn)略視角的執(zhí)行,并保障了其迄今為止的技術(shù)領(lǐng)先性。
4、領(lǐng)先性:大模型的迭代適配能力。
談到技術(shù)領(lǐng)先性,除了超級(jí)AI戰(zhàn)略視角,以及在專利技術(shù)領(lǐng)域投下的影子,更重要的還體現(xiàn)在大模型的不斷迭代適配,對(duì)于關(guān)鍵實(shí)體產(chǎn)業(yè)的真實(shí)賦能能力之上:
商湯已在通用模型領(lǐng)域,實(shí)現(xiàn)語言模型、圖像模型、多模態(tài)模型與AIGC(內(nèi)容生成)“四箭齊發(fā)”,同時(shí)據(jù)商湯2022年年報(bào)顯示,截至去年年末,在專用模型領(lǐng)域,則已累計(jì)對(duì)外輸出商業(yè)模型達(dá)6.7萬個(gè)。以中國當(dāng)前產(chǎn)業(yè)高質(zhì)量轉(zhuǎn)型階段的關(guān)鍵抓手——智能汽車制造領(lǐng)域?yàn)槔?,商湯的智能汽車整車廠合作伙伴超過30家,AI模型及技術(shù)服務(wù)滲透涉及車輛超過800萬輛。
一言以蔽之,商湯已率產(chǎn)業(yè)之先拿到了通向AI原生時(shí)代的那張船票。
不要聽他怎么說,而要看他怎么做
中國的AI原生時(shí)代盜火者正在砥礪而行。但必須事實(shí)求是地是,當(dāng)前而言,我們?nèi)蕴幱诖竽P偷摹懊と嗣蟆彪A段,每一個(gè)角度似乎都是真相,但其實(shí)又只是拼圖。
正因?yàn)檫h(yuǎn)景的模糊,使得噪音不斷。故而識(shí)別其中的趨勢(shì),一個(gè)簡單的方法論在于:不要聽他怎么說,而要看他怎么做,以及做的怎么樣。
根據(jù)最樸素的經(jīng)濟(jì)學(xué)原理,AI能給產(chǎn)業(yè)帶來什么價(jià)值,無非是從供給需求兩個(gè)維度去看:即,供給端能有什么效率提升;需求端能有什么效用收獲。
從商湯科技的系列動(dòng)作值中,我們其實(shí)可以清晰看到針對(duì)系列問題的求解邏輯與路徑:
什么是優(yōu)質(zhì)供給?基礎(chǔ)算力基座+大模型體系+生成式AI應(yīng)用
什么是有效需求?從專用,走向通用,再走向?qū)S谩?/p>
【1】什么是大模型時(shí)代的優(yōu)質(zhì)供給?
當(dāng)一個(gè)供給不夠優(yōu)質(zhì)的時(shí)候,談?wù)撔枨鬅o異于緣木求魚。智能手機(jī)的iPhone,新能源汽車的Model 3,之所以被人反復(fù)咀嚼就是由于其在供給端做出了劃時(shí)代的貢獻(xiàn)。
AI其實(shí)并不新,作為一個(gè)發(fā)展了數(shù)十年的行業(yè),之所以在2023年引起全球的高度關(guān)注,就是由于ChatGPT讓人看到大模型帶來的奇點(diǎn)效應(yīng)。但大模型僅僅只是開始質(zhì)變的原點(diǎn),未來真正的優(yōu)質(zhì)供給仍在緊鑼密鼓的構(gòu)建中。大模型時(shí)代,亟待賦能的是千行百業(yè),真正優(yōu)質(zhì)的供給需要?jiǎng)討B(tài)體系化的AI基礎(chǔ)設(shè)施。
該怎么理解動(dòng)態(tài)體系?
1)大模型時(shí)代的基礎(chǔ)設(shè)施需要成體系
算力無疑是資本市場(chǎng)最火的投資賽道,但目前市場(chǎng)講的算力概念有所偏狹,僅局限于IDC,服務(wù)器,甚至是GPU。
但實(shí)際的AI算力基礎(chǔ)是“算力、數(shù)據(jù)、基礎(chǔ)算法”三位一體的,智能算力必須靠體系才能發(fā)揮作用,而不是簡單的硬件堆砌,不然IDC企業(yè)豈不是這一輪AI的領(lǐng)航員?可以作為佐證的是,最近隨著大家搶著下單完英偉達(dá)的A100后,發(fā)現(xiàn)高質(zhì)量的數(shù)據(jù)竟然是更高的門檻,而算法大部分人還只能依托于開源。
根據(jù)商湯聯(lián)合創(chuàng)始人楊帆的闡述:算法當(dāng)然可能體現(xiàn)基模型、計(jì)算法,或者說體現(xiàn)成一些AI運(yùn)算的一些工具。算力呈現(xiàn)的不僅是硬件的資源,還包括一整套的基礎(chǔ)軟件體系,是不是能夠把幾千張卡連在一起去做一個(gè)訓(xùn)練。數(shù)據(jù)也不僅是數(shù)據(jù)本身的積累,還包括處理數(shù)據(jù)的能力、整合數(shù)據(jù)的能力、使用數(shù)據(jù)的know-how。
商湯從成立之初便在這三要素上蓄力,比如前瞻性的擴(kuò)容智能算力(AIDC)就是一大佐證,公司當(dāng)前AIDC運(yùn)行GPU接近3萬片,能夠輸出高達(dá)5000p的總算力,躋身國內(nèi)智能算力第一梯隊(duì)。
顯然供公司的布局不限于此,伴隨著 AI技術(shù)的升級(jí),商湯開始嘗試將自己這些先進(jìn)的能力提煉出來,定義成一個(gè)AI基礎(chǔ)設(shè)施——AI大裝置SenseCore。這個(gè)大裝置不僅成為公司迭代大模型的核心引擎,而且也能為業(yè)內(nèi)提供一個(gè)足夠低成本、低門檻的服務(wù)。
圖:商湯AI大裝置SenseCre為大模型體系提供算力支持
2)大模型時(shí)代“喜新厭舊”,需要及時(shí)動(dòng)態(tài)迭代
由于要面對(duì)千行百業(yè),大模型現(xiàn)在離人們的期待還有著巨大的差距,根據(jù)用戶/客戶進(jìn)行及時(shí)的優(yōu)化,是模型迭代的最優(yōu)路徑。或者說,客戶就是最好的產(chǎn)品經(jīng)理,而這對(duì)于更新提出了近乎變態(tài)的要求,畢竟傳統(tǒng)企業(yè)的產(chǎn)品最快也是按年為計(jì)量單位來進(jìn)行迭代的。
商湯于2023年4月份,基于其AI大裝置SenseCore,推出了“日日新SenseNova”大模型體系,包括語言大模型,以及文生圖、2D/3D數(shù)字人生成、大場(chǎng)景/小物體生成大模型。這個(gè)大模型體系的名字就隱含了動(dòng)態(tài)迭代的愿景。
那么一個(gè)季度后,他們做的如何呢?商湯首席科學(xué)家王曉剛的訪談中對(duì)市場(chǎng)關(guān)切的這一問題做出了明確的回應(yīng):“我們的這種更新,每天也都是不斷的去接到用戶的調(diào)用,還有很多客戶,實(shí)際上是對(duì)我們模型有全方位的測(cè)試和評(píng)估,也會(huì)給出我們方向的建議,所以我們收到反饋以后,其實(shí)每隔幾天都會(huì)進(jìn)行一個(gè)快速的更新?!?/p>
簡單來說,“日日新”大模型的更新周期,是以天為單位的,也的確符合這個(gè)模型的“出廠設(shè)定”。正是由于這樣的更新速度,基于“日日新”這一生成式大模型,目前公司通用大模型已經(jīng)覆蓋視覺、語言、多模態(tài)、內(nèi)容生產(chǎn)四大領(lǐng)域。這種大模型快速開發(fā)、迭代能力,反映的就是很強(qiáng)的AI系統(tǒng)工程能力——
據(jù)7月7日,第六屆世界人工智能大會(huì)(WAIC 2023)期間,商湯帶來的最新分享顯示,“商湯日日新SenseNova”大模型體系,已于日前再度實(shí)現(xiàn)了重大迭代升級(jí):
- 千億級(jí)參數(shù)的自然語言處理模型商湯商量SenseChat 2.0版本,突破了大語言模型輸入長度的限制,并推出不同參數(shù)量級(jí)的模型版本,可無縫適配移動(dòng)端、云端等不同終端及場(chǎng)景的應(yīng)用需求,降低部署成本。
- 生成式大模型商湯秒畫SenseMirage 3.0的模型參數(shù)從今年4月首次發(fā)布以來的10億提升至70億量級(jí),能夠?qū)崿F(xiàn)專業(yè)攝影級(jí)的圖片細(xì)節(jié)刻畫。
- 如影SenseAvatar 2.0數(shù)字人生成平臺(tái)相較1.0版本的語音和口型流暢度提升30%以上,實(shí)現(xiàn)4K高清視頻效果,并帶來AIGC生成形象及數(shù)字人歌唱功能。
- 3D內(nèi)容生成平臺(tái)瓊宇SenseSpace 2.0的空間重建效率提升20%,渲染性能提升50%,每100平方公里場(chǎng)景的建圖時(shí)間僅需38小時(shí)即可完成(1200 TFLOPS/秒算力支持)。
- 另一3D內(nèi)容生成平臺(tái)格物SenseThings 2.0對(duì)小物體的紋理及材質(zhì)還原達(dá)到毫米級(jí)精細(xì)度,并突破對(duì)高反光和鏡面物體的采集難題。
于AI玩家而言,鍛造優(yōu)質(zhì)供給的最終目的,就是為了讓 AI技術(shù)更加低成本、低門檻、高效率的進(jìn)入到各個(gè)場(chǎng)景里面。在絕大部分企業(yè)還在三要素—“算力、數(shù)據(jù)、算法”—中顧此失彼的時(shí)候,商湯“大算力+大模型”的AGI戰(zhàn)略,在供給側(cè)無疑取得了得天獨(dú)厚的先發(fā)優(yōu)勢(shì)。
【2】什么是大模型時(shí)代的有效需求?
7月18日,Microsoft在合作伙伴大會(huì)上官宣Copilot的定價(jià)為:每用戶每月額外支付30美元。隨著微軟吹響AI+辦公應(yīng)用落地的發(fā)令槍,AI的商業(yè)化探索,正式成為每一個(gè)頭部AI供應(yīng)者現(xiàn)在需直面的頭等大事。
但到底什么是有效的需求,目前的爭議遠(yuǎn)遠(yuǎn)大于供給側(cè)的技術(shù)路線之爭。我們認(rèn)為,大模型時(shí)代的有效需求,是先解決用戶的通用性問題,然后再解決用戶的專用性問題。這就像計(jì)算機(jī)的發(fā)明,首先解決的是計(jì)算這個(gè)通用性剛需,然后再是垂直向下解決如辦公、娛樂、畫圖、視頻等專用個(gè)性化需求。
為了解決通用性問題,AI的供應(yīng)商,需要提供牢靠的通用性量子能力,比如行業(yè)的文本能力已相對(duì)成熟,但視頻、圖像等能力尚待突破,最終必然要構(gòu)建多模態(tài)能力。而針對(duì)專用問題,勢(shì)必要下沉到行業(yè)中去,與行業(yè)的專用數(shù)據(jù)和產(chǎn)業(yè)規(guī)律浸泡在一起,尋找最短路徑的解決方案。
圖:突破供給瓶頸后,AI將在需求側(cè)解決“通用”和“專用”兩個(gè)層次的問題
1)從專用走向通用
追本溯源,AI以前沒有進(jìn)入大眾生活最重要的原因,就是由于其不夠通用。在上一輪AI熱潮中,我們還是只能用相對(duì)比較高昂的代價(jià)解決某些特定的問題,比如人臉識(shí)別、拍照防抖、自動(dòng)駕駛。就好像專業(yè)的運(yùn)動(dòng)員,只能在特定的項(xiàng)目上表現(xiàn)優(yōu)異,而人們期待的是一個(gè)“全能選手”。簡單來說,以前的AI的智能不夠通用。
大模型促使AI時(shí)代躍遷到AGI時(shí)代,其中的G就是通用的意思。正是由于大模型時(shí)代的到來,使得AI終于有了“人”的影子,我們便可以暢想,AI能夠替代或者幫助人去做哪些事情。
具體來說,2023 年起的大模型涌現(xiàn),標(biāo)志著AI已經(jīng)從專用任務(wù)轉(zhuǎn)向通用任務(wù),或是以自然語言人機(jī)接口的方式呈現(xiàn),能讓機(jī)器遵循人的主觀意志實(shí)現(xiàn)更廣泛的功能。比如在算法方面,大模型的表達(dá)能力越來越強(qiáng)、規(guī)模越來越大,自主學(xué)習(xí)能力越來越強(qiáng),從專用向通用趨勢(shì)顯著,你可以讓AI扮演你的老師、助手、伙伴。
回歸到商業(yè)模型視角,不管是to B還是to C,大模型不再局限于某一個(gè)垂類,而是提供通用型的量子能力,解決“剛需”,比如文本、圖像、視頻等跨模態(tài)的需求。用專業(yè)一點(diǎn)的話來講,大模型需要演化成MaaS(Model-as-a-Service,模型即服務(wù)),利用大模型的通用能力,提供泛化的服務(wù)。
一體兩面,判斷一個(gè)公司的大模型是否靠譜,最簡單的方法就是看其模型能否提供通用的服務(wù)。而這無疑,是一個(gè)高階的要求,因?yàn)閺膶S米呦蛲ㄓ?,需要積累大量的 know-how。
大部分人對(duì)商湯的印象還停留在機(jī)器視覺龍頭公司的階段,實(shí)際上過去8年,商湯靠專用積累實(shí)現(xiàn)蛻變,將技術(shù)迭代泛化到通用,多模態(tài)和多場(chǎng)景已然不然話下。
我們以智能汽車這一大家高度關(guān)注的領(lǐng)域?yàn)槔_@一場(chǎng)景對(duì)智能的要求是方方面面的,細(xì)分場(chǎng)景包括駕駛域、坐艙、車路等,交互又包括語音、文本、觸控等多種方式,非常復(fù)雜。對(duì)于這一問題,商湯的絕影智能汽車提出了“駕、艙、云”三位一體的戰(zhàn)略,規(guī)劃未來在智能汽車領(lǐng)域成為通用人工智能核心供應(yīng)商。
僅僅在座艙,公司打造的車艙大腦就分為四個(gè)層次:
1)車端,包括攝像頭和各種感知硬件,感知車控包括娛樂在內(nèi)的各種車內(nèi)狀態(tài),以及各種長短的記憶模塊;
2)云端,在強(qiáng)大的AIDC基礎(chǔ)設(shè)施和日日新大模型的加持下,發(fā)揮云端決策和推理能力,協(xié)同調(diào)動(dòng)車內(nèi)資源,去控制車內(nèi)各部分和APP,輸出強(qiáng)大豐富的內(nèi)容,生成車內(nèi)智能化的操作系統(tǒng);
3)往上附加,絕影智能車艙支撐了十多項(xiàng)各種應(yīng)用,大大提升駕乘安全性,豐富娛樂功能,提供智能化教育服務(wù),最終大幅度提升在車內(nèi)的各種操作,還有工作效率;
4)另外,通過虛擬助手的方式,跟乘客實(shí)現(xiàn)擬人化的交互。
商湯作為一家to b企業(yè),做大模型需要更多的考慮AI的泛化能力,更高的泛化能力意味著解決某一領(lǐng)域全棧需求的能力及整體解決方案的壁壘越強(qiáng)。
圖:商湯面向客戶提供多種MaaS服務(wù)
2)從通用再次下沉專用
但為了更好的讓AI提高各行各業(yè)的滲透率,除了極強(qiáng)的通用能力外,還要結(jié)合行業(yè)的專業(yè)知識(shí),即“從群眾中來,到群眾中去”。AI供應(yīng)商需要利用大模型的通用能力去應(yīng)對(duì)多樣化、碎片化的應(yīng)用場(chǎng)景,這一步需要積累眾多的行業(yè)大量的know-how。
對(duì)商湯而言,在日日新大模型體系下,生成式AI應(yīng)用就是降維的事情。當(dāng)前公司已經(jīng)推出的商量SenseChat(語言大模型)、秒畫SenseMirage(文生圖創(chuàng)作平臺(tái))、如影SenseAvatar(AI數(shù)字人視頻生產(chǎn)平臺(tái))、瓊宇SenseSpace(3D場(chǎng)景生成平臺(tái))、格物SenseThings(3D內(nèi)容生成平臺(tái))等,正高效嵌入千行百業(yè)之中:
1)在金融領(lǐng)域,商湯與銀行、保險(xiǎn)、券商等客戶展開合作,利用數(shù)字人進(jìn)行智能客服、智慧營銷等工作,并通過接入大語言模型能力,提供投研分析、研報(bào)撰寫等新功能,實(shí)現(xiàn)降本增效。
2)在醫(yī)療場(chǎng)景,商湯基于海量醫(yī)學(xué)知識(shí)和臨床數(shù)據(jù)打造了中文醫(yī)療語言大模型“大醫(yī)”,提供導(dǎo)診、問診、健康咨詢、輔助決策等多場(chǎng)景多輪會(huì)話能力,未來也即將支持醫(yī)學(xué)圖像、文本、結(jié)構(gòu)化數(shù)據(jù)等多模態(tài)綜合分析,并可不斷提升醫(yī)療語言理解和推理能力。
3)移動(dòng)終端,依托商湯大模型的輕量化版本,輕松實(shí)現(xiàn)在移動(dòng)終端的部署和運(yùn)行,帶來多種智能交互解決方案,包括針對(duì)信息獲取的問答交互,針對(duì)生活場(chǎng)景的知識(shí)交互,針對(duì)語言和圖像生成的內(nèi)容交互等。
4)線下場(chǎng)景,商湯通過大模型能力為電網(wǎng)巡檢帶來長尾故障識(shí)別、復(fù)雜缺陷判斷等智能解決方案?;诃傆?.0的空間重建,商湯為濟(jì)南馬山鎮(zhèn)區(qū)域開發(fā)、合肥中國視界園區(qū)、上海瑞金醫(yī)院等打造實(shí)景空間的數(shù)字孿生,提升運(yùn)營管理效率。在珠寶行業(yè),依托格物2.0商湯為珠寶品牌進(jìn)行珠寶首飾復(fù)刻,細(xì)致展現(xiàn)商品工藝特點(diǎn),提升顧客購物體驗(yàn)。
以上可見,商湯正積極通過大模型的多模態(tài)能力組合賦能產(chǎn)業(yè)升級(jí),并為中國的AI原生時(shí)代帶來諸多引領(lǐng)行業(yè)的全新突破。
結(jié)語
AI 已然成為數(shù)字經(jīng)濟(jì)時(shí)代的新基建,硬核創(chuàng)新者,已經(jīng)在錘煉供給——落地需求——優(yōu)化供給——升級(jí)需求的正循環(huán)中,轉(zhuǎn)動(dòng)了智慧的飛輪。我們有幸看到大模型時(shí)代產(chǎn)業(yè)趨勢(shì)的盜火者,已經(jīng)手捧火炬接棒未來。