作者 |??ZeR0,編輯?|??漠影
AI是第三次計(jì)算革命,而中國(guó)是最佳的孵化地。
2024年轉(zhuǎn)眼已經(jīng)過(guò)了一半,從Sora模型引起開(kāi)年轟動(dòng)至今,生成式AI領(lǐng)域生出許多新變數(shù)。
一些預(yù)言陸續(xù)被現(xiàn)實(shí)驗(yàn)證:國(guó)內(nèi)AI視頻生成模型進(jìn)展飛速,手機(jī)和PC大廠掀起AI狂歡,AI新硬件曇花一現(xiàn),智算建設(shè)大潮將英偉達(dá)送入3萬(wàn)億美元市值俱樂(lè)部,熱錢持續(xù)涌向AI創(chuàng)企……一些國(guó)內(nèi)限定的現(xiàn)象級(jí)事件出現(xiàn):AI賣課先賺到第一桶金,上下文長(zhǎng)度卷向1000萬(wàn)漢字,大模型價(jià)格戰(zhàn)瘋狂開(kāi)打,AI黏土特效風(fēng)靡社交網(wǎng)絡(luò),AI Infra創(chuàng)企們忙著把大模型成本打下來(lái)……
燒錢與賺錢、動(dòng)力與陷阱、技術(shù)突破與應(yīng)用變革……圍繞這些AI發(fā)展必經(jīng)的權(quán)衡選擇,中國(guó)在AI領(lǐng)域最早投資且布局最豐富的投資機(jī)構(gòu)攢了個(gè)局,把十多家中國(guó)通用大模型、多模態(tài)大模型、AI Infra、具身智能、生成式AI應(yīng)用的活躍創(chuàng)業(yè)者們聚集在一起,集中輸出他們的思考與洞見(jiàn)。一切都在被AI改造,沒(méi)有什么能阻擋Scaling Law的步伐,但對(duì)AGI的長(zhǎng)期信仰尚不足以掩蓋眼前現(xiàn)實(shí)的商業(yè)化困境,業(yè)界還在等待一個(gè)真正屬于大模型時(shí)代的超級(jí)應(yīng)用的誕生。以下是信息干貨:
01.生成式AI應(yīng)用落地需解決三大問(wèn)題,多模態(tài)應(yīng)用創(chuàng)企比例上升
啟明創(chuàng)投從2013年開(kāi)始系統(tǒng)性布局AI領(lǐng)域,至今已超過(guò)50個(gè)項(xiàng)目上投資超過(guò)60億元人民幣或等值美元,其中近20家在二級(jí)市場(chǎng)上市或成長(zhǎng)為獨(dú)角獸企業(yè)。在其投資企業(yè)中,有10家中國(guó)大語(yǔ)言模型、多模態(tài)模型或具身智能模型研發(fā)領(lǐng)域的領(lǐng)軍企業(yè),數(shù)量居全國(guó)之首。
在啟明創(chuàng)投主管合伙人周志峰看來(lái),生成式AI應(yīng)用落地仍需解決三個(gè)問(wèn)題:
1、降低模型使用成本。未來(lái)一兩年,生成式AI仍有巨大的成本下降空間,下降到1/1000是大概率事件。成本越低,AI技術(shù)落地才會(huì)更容易。
2、提升大模型的效果。大模型幻覺(jué)問(wèn)題不可避免,另外兩個(gè)效果問(wèn)題也很重要:一個(gè)是用戶向某個(gè)語(yǔ)言模型或產(chǎn)品提出誤導(dǎo)性問(wèn)題后,模型應(yīng)該怎么回答;二是大模型應(yīng)用在具體場(chǎng)景下生成的回答或內(nèi)容,對(duì)這個(gè)場(chǎng)景來(lái)說(shuō)是否準(zhǔn)確和合適。
3、增強(qiáng)用戶留存率。第一波生成式AI應(yīng)用的留存率相對(duì)較低,跟互聯(lián)網(wǎng)頭部應(yīng)用沒(méi)法比。怎樣讓大家真正把生成式AI產(chǎn)品變成生活或工作的一部分,無(wú)論是Save Time還是Kill Time,是接下來(lái)發(fā)展的重要問(wèn)題。
據(jù)啟明創(chuàng)投統(tǒng)計(jì)分析,生成式AI正在三個(gè)“C領(lǐng)域”——Copilot(生產(chǎn)力工具)、Creativity(創(chuàng)意)、Companionship(陪伴)獲得了大量用戶的青睞,正在經(jīng)歷從提高效率(Save Time)類應(yīng)用向獲得愉悅(Kill Time)類應(yīng)用的轉(zhuǎn)變。這與當(dāng)年互聯(lián)網(wǎng)應(yīng)用的發(fā)展軌跡類似。去年啟明創(chuàng)投對(duì)當(dāng)前發(fā)展階段生成式AI產(chǎn)業(yè)脈絡(luò)的梳理,這個(gè)三層架構(gòu)至今也沒(méi)有太大的變化。今天依然可以順著這樣的脈絡(luò)繼續(xù)投資。
根據(jù)啟明創(chuàng)投去年對(duì)兩百多家中國(guó)生成式AI企業(yè)的深度交流后進(jìn)行的統(tǒng)計(jì),當(dāng)時(shí)企業(yè)以生產(chǎn)力工具為主,46%的企業(yè)都做Save Time類應(yīng)用。
這也比較符合技術(shù)發(fā)展趨勢(shì),當(dāng)技術(shù)不夠成熟時(shí),先會(huì)誕生出一些開(kāi)發(fā)工具,提供給比較專業(yè)的用戶使用。其他領(lǐng)域包括Chatbot、智能助手、娛樂(lè)應(yīng)用等,占比都不是很大。在基礎(chǔ)架構(gòu)方面,去年創(chuàng)企主要是研發(fā)基礎(chǔ)模型的企業(yè)和一些做大模型分布式訓(xùn)練平臺(tái)的企業(yè)。到今年上半年,根據(jù)啟明創(chuàng)投對(duì)深度交流過(guò)的400余家AI創(chuàng)業(yè)企業(yè)的統(tǒng)計(jì),多模態(tài)應(yīng)用的比例呈上升趨勢(shì),出現(xiàn)許多基于AI大模型技術(shù)的新應(yīng)用類別,同時(shí)更多創(chuàng)企深耕某個(gè)垂直行業(yè)和場(chǎng)景,而基礎(chǔ)設(shè)施層的技術(shù)創(chuàng)業(yè)方向也更加多元化。
02.2024生成式AI十大展望:多智能體技術(shù)飛躍,視頻生成將全面爆發(fā)
2024年,周志峰認(rèn)為生成式AI的技術(shù)底座還在高速動(dòng)態(tài)發(fā)展中,視覺(jué)語(yǔ)言模型、MoE、Agent、RAG等技術(shù)方向都在快速發(fā)展。啟明創(chuàng)投如今提出新的生成式AI十個(gè)展望:
1、當(dāng)前生成式AI的兩大核心技術(shù)GPT和擴(kuò)散模型將逐步融合,激發(fā)全新模型能力;
2、高質(zhì)量數(shù)據(jù)的獲取和組織將顯著影響新一代模型,合成數(shù)據(jù)在預(yù)訓(xùn)練中的占比將大幅提升;
3、多智能體(Multi-Agent)技術(shù)將飛躍,通過(guò)優(yōu)化協(xié)作和分工顯著提升生成式AI效率和效果;
4、將出現(xiàn)圖像和文本的統(tǒng)一連續(xù)表示,并且基于此的圖文聯(lián)合擴(kuò)散模型將達(dá)到GPT-4o級(jí)別能力;
5、圖像和視頻隱空間表示的壓縮率提升五倍以上,從而使生成速度提升5倍以上;
6、3年內(nèi)視頻生成將全面爆發(fā),結(jié)合3D能力,可控的視頻生成將對(duì)影視、動(dòng)畫(huà)、短片的生產(chǎn)模式帶來(lái)變革;
7、我們將見(jiàn)證壓縮更多模態(tài)信息的超級(jí)多模態(tài)大模型,如文本、圖像、語(yǔ)音、音樂(lè)、3D、傳感器數(shù)據(jù)(控制信號(hào)、眼動(dòng)信號(hào)、手勢(shì)信息、雷達(dá)信號(hào)等);
8、生成式AI打通了人類語(yǔ)言與機(jī)器語(yǔ)言的轉(zhuǎn)換通道,命令機(jī)器完成復(fù)雜任務(wù)的成本將顯著降低,帶來(lái)巨大的生產(chǎn)力變革;
9、端側(cè)推理會(huì)有巨大增長(zhǎng),來(lái)自三個(gè)因素的疊加:推理優(yōu)化算法+端側(cè)推理芯片+端側(cè)大模型;
10、AI將在多個(gè)數(shù)字化水平較高的行業(yè)中占據(jù)主導(dǎo)地位,并將重塑絕大部分企業(yè)軟件。
03.熱錢投向生成式AI應(yīng)用
從創(chuàng)業(yè)和投資角度來(lái)看,AI領(lǐng)域機(jī)會(huì)很大。據(jù)摩根士丹利的數(shù)據(jù)及啟明創(chuàng)投科技團(tuán)隊(duì)的分析和評(píng)估,僅是2023年,全球一級(jí)市場(chǎng)在AI領(lǐng)域的投資金額達(dá)到了224億美元,超過(guò)了過(guò)去十年加起來(lái)的總和。224億美元中,超過(guò)2/3的錢投向從事基礎(chǔ)設(shè)施或模型研發(fā)的企業(yè),約20%投向生成式AI應(yīng)用企業(yè)。周志峰預(yù)測(cè)今年及未來(lái)兩三年,兩者的比例會(huì)顯著轉(zhuǎn)變,越來(lái)越多的資金將投給應(yīng)用企業(yè)。
去年世界人工智能大會(huì)上提起生成式AI的典型應(yīng)用主要有三個(gè):ChatGPT、Character.ai、和Midjourney。而今年,AI應(yīng)用已經(jīng)品類眾多。
啟明創(chuàng)投在AI領(lǐng)域的投資策略已經(jīng)發(fā)生演變,從將AI視為一個(gè)技術(shù)或一個(gè)垂直領(lǐng)域去進(jìn)行投資,轉(zhuǎn)變?yōu)閷⑵湟暈榛A(chǔ)能力、去尋找其在千行百業(yè)落地的巨大潛力,今年起重點(diǎn)關(guān)注7類生成式AI應(yīng)用:垂直行業(yè)AI(Vertical AI),企業(yè)AI (Enterprise AI), AI交互平臺(tái),AI內(nèi)容平臺(tái),AI工具,AI游戲,AI硬件?!皬耐顿Y數(shù)量上來(lái)講,未來(lái)我們投資的企業(yè)80%都會(huì)是生成式AI的應(yīng)用公司?!敝苤痉逭f(shuō)。他認(rèn)為生成式AI仍處在其發(fā)展周期的早期階段,相較于互聯(lián)網(wǎng)浪潮中應(yīng)用的落地時(shí)間點(diǎn),當(dāng)前AI浪潮中應(yīng)用的爆發(fā)預(yù)計(jì)將會(huì)顯著提前。
與互聯(lián)網(wǎng)時(shí)代不同,AI的應(yīng)用不需要等待5~8年才會(huì)迎來(lái)大規(guī)模爆發(fā)。這是因?yàn)檫^(guò)去幾十年,互聯(lián)網(wǎng)、移動(dòng)互聯(lián)網(wǎng)、大數(shù)據(jù)、云計(jì)算等技術(shù)的飛速發(fā)展已經(jīng)為整個(gè)生態(tài)系統(tǒng)奠定了堅(jiān)實(shí)基礎(chǔ)。因此AI應(yīng)用將會(huì)與底層技術(shù)同步發(fā)展,我們目前既處于互聯(lián)網(wǎng)90年代那樣的基礎(chǔ)設(shè)施建設(shè)階段,同時(shí)也接近于2000年左右的應(yīng)用發(fā)展水平。生成式AI應(yīng)用企業(yè)從0到1的成長(zhǎng)時(shí)間比其他領(lǐng)域更長(zhǎng),需要同時(shí)克服TPF(技術(shù)-產(chǎn)品契合度)和PMF(產(chǎn)品-市場(chǎng)契合度)兩大挑戰(zhàn)。
所以,創(chuàng)始團(tuán)隊(duì)需要更大的耐心和決心,理解技術(shù)(技術(shù)的邊際)、理解產(chǎn)品(原生AI產(chǎn)品的新特點(diǎn)和新分發(fā)機(jī)制)、理解世界(全球化發(fā)展的機(jī)會(huì))。周志峰將生成式AI創(chuàng)業(yè)者歸納為三類典型畫(huà)像:一是AI科學(xué)家,來(lái)自研究機(jī)構(gòu)或科技大廠的AI研發(fā)部門;二是產(chǎn)業(yè)專家,對(duì)某個(gè)行業(yè)特別了解,或是產(chǎn)品、運(yùn)營(yíng)等的高手;三是新銳創(chuàng)業(yè)者,有越來(lái)越多的95后甚至00后的創(chuàng)業(yè)者。
在技術(shù)還未成熟時(shí)找到合適的產(chǎn)品形態(tài)。三類創(chuàng)始人都有各自明顯的優(yōu)點(diǎn)和缺點(diǎn)。目前來(lái)看AI科學(xué)家創(chuàng)始人占比約1/3,這說(shuō)明技術(shù)浪潮還處于發(fā)展早期階段,這類人群對(duì)技術(shù)底座的邊界掌握地更精準(zhǔn),對(duì)技術(shù)發(fā)展的感知也更敏捷。周志峰認(rèn)為在未來(lái)兩三年,第二類、第三類創(chuàng)始人的占比會(huì)持續(xù)顯著上升,并成為主流。
04.AI原生應(yīng)用落地遇難點(diǎn),AGI發(fā)展需要多種方法融合
多家AI創(chuàng)企在本月發(fā)布新品。無(wú)問(wèn)芯穹發(fā)布了全球首個(gè)支持單任務(wù)千卡規(guī)模異構(gòu)芯片混合訓(xùn)練平臺(tái);階躍星辰發(fā)布了三款Step系列通用大模型新品,全面升級(jí)通用大模型底座能力;無(wú)限光年發(fā)布了光語(yǔ)大模型,灰盒可信,百億參數(shù)模型優(yōu)于超大規(guī)模模型GPT-4 Turbo。
大模型的訓(xùn)練和推理都需要強(qiáng)大的算力資源支撐。在無(wú)問(wèn)芯穹聯(lián)合創(chuàng)始人、CEO夏立雪看來(lái),AI Native應(yīng)用落地面臨4個(gè)關(guān)鍵Infra問(wèn)題:1)激活“沉睡芯片”并促進(jìn)異構(gòu)算力整合;2)提升多種計(jì)算卡大模型計(jì)算性能;3)為大規(guī)模訓(xùn)練集群穩(wěn)定訓(xùn)/推夯實(shí)基座;4)更為高效地利用有限的端側(cè)計(jì)算資源。
階躍星辰創(chuàng)始人、CEO姜大昕認(rèn)為,探索AGI路徑,“Scaling Law”和“多模態(tài)”相輔相成、缺一不可,兩個(gè)方向齊頭并進(jìn),最終到達(dá)AGI。他相信Scaling Law依然奏效,模型性能仍在隨著參數(shù)量、數(shù)據(jù)量和計(jì)算量的增加呈冪次方增長(zhǎng)。他相信多模態(tài)是構(gòu)建世界模型的基礎(chǔ)能力,也是通向AGI的必經(jīng)之路,從算法角度可以分為三個(gè)階段:第一個(gè)階段是模擬世界;第二個(gè)階段是探索世界,將大模型與具身智能結(jié)合;最終階段是大模型要?dú)w納和總結(jié)物理世界的規(guī)律,發(fā)現(xiàn)人類尚未發(fā)現(xiàn)的規(guī)律。這三個(gè)階段不是依次展開(kāi),而是可以并行發(fā)展,但進(jìn)化速度可能不同。
復(fù)旦大學(xué)浩清特聘教授、上??茖W(xué)智能研究院院長(zhǎng)、無(wú)限光年創(chuàng)始人漆遠(yuǎn)認(rèn)為Scaling Law并不會(huì)直接引領(lǐng)達(dá)到AGI,AGI的目標(biāo)是發(fā)現(xiàn)復(fù)雜世界的未知規(guī)律,而當(dāng)前大模型都高度依賴數(shù)據(jù),而未知規(guī)律可能缺乏海量數(shù)據(jù)支撐。據(jù)他分析,目前大模型主要是聯(lián)結(jié)學(xué)派的“黑盒”概率預(yù)測(cè),如果將符號(hào)計(jì)算與大模型相結(jié)合,就能同時(shí)具備慢思考的“白盒”邏輯能力,兩種方法的融合是AGI發(fā)展的重要方向,實(shí)現(xiàn)“灰盒”可信。
深度學(xué)習(xí)能實(shí)現(xiàn)數(shù)據(jù)擬合,且可以延展至數(shù)據(jù)沒(méi)有的地方,當(dāng)知識(shí)規(guī)則和關(guān)鍵數(shù)據(jù)矛盾時(shí),能夠調(diào)整知識(shí)規(guī)則,擺脫數(shù)據(jù)依賴。“灰盒”可以通過(guò)符號(hào)計(jì)算與神經(jīng)網(wǎng)絡(luò)的結(jié)合,應(yīng)對(duì)大模型的幻覺(jué)問(wèn)題和垂直領(lǐng)域的專業(yè)問(wèn)題。
05.AI超級(jí)應(yīng)用何時(shí)出現(xiàn)?面臨哪些挑戰(zhàn)?
對(duì)于AI超級(jí)應(yīng)用何時(shí)出現(xiàn),周志峰分享了他很喜歡的一個(gè)西方樂(lè)隊(duì)的一句經(jīng)典歌詞:“我們只需要一點(diǎn)點(diǎn)耐心。”“超級(jí)應(yīng)用的來(lái)臨,不會(huì)是貝多芬的《命運(yùn)交響曲》,一上來(lái)就是強(qiáng)烈的節(jié)奏,一種命運(yùn)在敲門的感覺(jué)。應(yīng)用的孕育是漸進(jìn)式的,更像是《梁?!?,先是隱隱約約的鼓聲,慢慢一支長(zhǎng)笛漸強(qiáng)地引入,再到后面的小提琴主題段落?!彼劦溃拔覀兘裉煲呀?jīng)能夠聽(tīng)到AI應(yīng)用隱隱約約的鼓點(diǎn)從遠(yuǎn)方傳來(lái),讓我們大家都保持一點(diǎn)耐心,共同期待那些卓越的應(yīng)用的誕生?!?strong>1、未來(lái)生成式AI產(chǎn)業(yè)有望誕生哪些超級(jí)應(yīng)用?智譜AI COO張帆認(rèn)為,大模型的核心在于提升人機(jī)交互的帶寬,每次交互帶寬的提升都會(huì)重構(gòu)用戶需求和應(yīng)用方式。企業(yè)和開(kāi)發(fā)者能通過(guò)MaaS平臺(tái)降低使用和訓(xùn)練模型的成本,更容易地探索和構(gòu)建超級(jí)應(yīng)用。在他看來(lái),未來(lái)幾年內(nèi)可能出現(xiàn)顛覆性的超級(jí)應(yīng)用,但這些應(yīng)用往往難以預(yù)先設(shè)計(jì),而是通過(guò)不斷迭代逐步出現(xiàn)。AI時(shí)代將涌現(xiàn)出許多難以想象的應(yīng)用。這一過(guò)程需要算力、網(wǎng)絡(luò)、硬件水平和用戶習(xí)慣的提升,以及遵循從小規(guī)模應(yīng)用開(kāi)始逐步發(fā)展的原則。米粿AI的目標(biāo)是成為AI漫畫(huà)和動(dòng)漫平臺(tái)的領(lǐng)軍者,致力于結(jié)合AI技術(shù)與內(nèi)容生產(chǎn)。米粿AI創(chuàng)始人、CEO丁黎預(yù)測(cè)未來(lái)幾年內(nèi),繪圖、漫畫(huà)和2D動(dòng)畫(huà)等領(lǐng)域?qū)?huì)出現(xiàn)顛覆性的超級(jí)應(yīng)用。悉之智能專注于AI教育,悉之智能創(chuàng)始人、CEO孫一喬預(yù)測(cè),未來(lái)超級(jí)應(yīng)用應(yīng)從需求出發(fā),垂直解決問(wèn)題,教育是很有潛力的領(lǐng)域,教育領(lǐng)域頻次高、需求剛性,易出現(xiàn)AI超級(jí)應(yīng)用。無(wú)限光年COO朱劍雄認(rèn)為,未來(lái)幾年內(nèi),超級(jí)應(yīng)用將在多個(gè)領(lǐng)域涌現(xiàn)。從PC互聯(lián)網(wǎng)時(shí)代到移動(dòng)互聯(lián)網(wǎng)時(shí)代,流量入口的轉(zhuǎn)變提供了參考,大模型時(shí)代也會(huì)出現(xiàn)類似的趨勢(shì),場(chǎng)景服務(wù)能力深厚的公司可能會(huì)成長(zhǎng)為超級(jí)應(yīng)用。2、生成式AI超級(jí)應(yīng)用需克服哪些挑戰(zhàn)?談及挑戰(zhàn),丁黎認(rèn)為與行業(yè)從業(yè)者形成友好生態(tài)系統(tǒng)非常重要。當(dāng)前AI創(chuàng)業(yè)需要高資本和高技術(shù)門檻,團(tuán)隊(duì)需團(tuán)結(jié)合作,共同應(yīng)對(duì)挑戰(zhàn),才能在激烈的市場(chǎng)競(jìng)爭(zhēng)中脫穎而出。朱劍雄提到產(chǎn)品經(jīng)理的角色和要求發(fā)生了變化?,F(xiàn)在的產(chǎn)品經(jīng)理不僅要定義場(chǎng)景和需求,還需將這些信息傳遞給大模型,進(jìn)行評(píng)測(cè)和驗(yàn)證。既懂模型又懂客戶的產(chǎn)品經(jīng)理目前市場(chǎng)上較為稀缺,但隨著時(shí)間推移,這一問(wèn)題將逐漸得到改善。銜遠(yuǎn)科技首席算法科學(xué)家丁寧則分享了兩個(gè)慣性陷阱:資源慣性和技術(shù)慣性。他還提到數(shù)據(jù)缺失問(wèn)題,特別是負(fù)信號(hào)比例高的場(chǎng)景缺乏高質(zhì)量數(shù)據(jù),是未來(lái)的一個(gè)關(guān)鍵挑戰(zhàn)。
06.探路具身智能:途徑、難點(diǎn)與終局
具身智能也是產(chǎn)學(xué)界共同關(guān)注的熱點(diǎn),關(guān)于技術(shù)路徑、落地方向、通用機(jī)器人的終極形態(tài)等問(wèn)題,有很多不同的聲音。清華大學(xué)助理教授、星動(dòng)紀(jì)元?jiǎng)?chuàng)始人陳建宇相信人形機(jī)器人會(huì)是通用機(jī)器人的終極形態(tài),不僅因?yàn)殡p足與雙手的純?nèi)诵涡螒B(tài)與現(xiàn)有環(huán)境的兼容性更好,在訓(xùn)練數(shù)據(jù)獲取上也更容易從人類世界中進(jìn)行遷移,未來(lái)機(jī)器人有望在各類任務(wù)上都做到極致性能。
在技術(shù)范式上,端到端大腦小腦融合方案會(huì)是未來(lái)很重要的研究方向,僅僅用人類語(yǔ)言作為大小腦之間的傳輸界面效果有限,可以借鑒目前自動(dòng)駕駛中的端到端聯(lián)合訓(xùn)練,物理層面數(shù)據(jù)直接反饋給圖文大模型將更好提升整體模型效果。陳建宇提出在不久的將來(lái),也許可以設(shè)計(jì)一種機(jī)器人的圖靈測(cè)試,有一個(gè)機(jī)器人和人來(lái)進(jìn)行交互,背后可能是智能的自主控制也可能是人類遙操作,當(dāng)技術(shù)發(fā)展到很難分辨機(jī)器人的背后是人工智能還是人類遙操作時(shí),可能便是機(jī)器人真正實(shí)現(xiàn)智能與通用的那一天。
上海交通大學(xué)教授、穹徹智能聯(lián)合創(chuàng)始人盧策吾是世界范圍內(nèi)第一位由機(jī)器人來(lái)給自己刮胡子的人類。他認(rèn)為具身智能的終局需要綜合考慮技術(shù)的迭代和商業(yè)的需求,具身智能作為承載硬件的軟件算法歡迎各種類型的機(jī)器人形態(tài)。對(duì)于具體的技術(shù)路徑,具身智能算法需要兩個(gè)核心要素,分別是能夠感知和理解世界的世界模型,以及具有強(qiáng)魯棒性的技能操作模型。
在操作模型中,力反饋機(jī)制十分重要,不僅是在圖像維度之外增加了一個(gè)交互維度,同時(shí)也可以減少對(duì)世界模型毫秒級(jí)別決策的依賴。穹徹智能展示的削黃瓜、疊衣服等技能都說(shuō)明了操作模型具有魯棒性后可以大大拓展?jié)撛诘膽?yīng)用空間。銀河通用前段時(shí)間發(fā)布了首代具有泛化性的具身大模型機(jī)器人。北京大學(xué)助理教授、北大-銀河通用聯(lián)合實(shí)驗(yàn)室主任王鶴認(rèn)為,人形機(jī)器人是未來(lái)整個(gè)通用機(jī)器人市場(chǎng)的最大公約數(shù),但在邁向這個(gè)終極目標(biāo)的過(guò)程中,需要每一步都有健康的商業(yè)模式讓機(jī)器人真正進(jìn)入場(chǎng)景,上半身擬人下半身底盤會(huì)是三年內(nèi)最可能落地的實(shí)際方案。
從技術(shù)角度,銀河通用非常關(guān)注小腦層面的技能控制模型如何實(shí)現(xiàn)足夠的泛化和通用。針對(duì)小腦技能,銀河通用自研合成了千萬(wàn)級(jí)的場(chǎng)景數(shù)據(jù)及十億級(jí)的抓取數(shù)據(jù),在合成數(shù)據(jù)的訓(xùn)練下,銀河通用機(jī)器人已實(shí)現(xiàn)抓取隨機(jī)放置的透明、高光等物體的成功率在95%以上。
具身智能機(jī)器人何時(shí)才能真正進(jìn)入嚴(yán)肅場(chǎng)景,進(jìn)行商業(yè)化量產(chǎn)落地?需要克服哪些挑戰(zhàn)?王鶴談到能落地的機(jī)器人需要足夠低的成本和足夠高的耐用性,這些都是需要技術(shù)公司不斷打磨硬件和供應(yīng)鏈能力,而國(guó)內(nèi)創(chuàng)企具有天然優(yōu)勢(shì)。
盧策吾補(bǔ)充說(shuō),還要快速POC,只有開(kāi)箱即用才能快速規(guī)?;?,對(duì)于成本硬件的駕馭能力和靈活組裝能力是降低成本的關(guān)鍵,“大腦”要足夠通用,落地的成本才夠低。陳建宇對(duì)國(guó)內(nèi)發(fā)展具身智能的前景保持樂(lè)觀,認(rèn)為每個(gè)創(chuàng)業(yè)公司都應(yīng)該思考如何利用中國(guó)市場(chǎng)的優(yōu)勢(shì),最大化撬動(dòng)國(guó)內(nèi)供應(yīng)鏈的優(yōu)勢(shì),打造具有全球化競(jìng)爭(zhēng)力的硬件產(chǎn)品。
07.結(jié)語(yǔ):AI計(jì)算新浪潮,看中國(guó)
在周志峰看來(lái),將邊際成本降至接近零的維度,恰好是評(píng)判一項(xiàng)技術(shù)能否成為最大的科技浪潮的關(guān)鍵標(biāo)準(zhǔn),微處理器、互聯(lián)網(wǎng)、人工智能是過(guò)去五十年科技發(fā)展史上最大的三個(gè)浪潮。微處理器將計(jì)算的邊際成本降到非常低,互聯(lián)網(wǎng)把分發(fā)成本降為零,生成式AI的核心是把數(shù)字化內(nèi)容創(chuàng)作的邊際成本幾乎降為零,由此看來(lái)AI技術(shù)一定會(huì)釋放巨大的價(jià)值。AI是第三次計(jì)算革命,而中國(guó)是最佳的孵化地。
中國(guó)的顯著優(yōu)勢(shì)是擁有龐大市場(chǎng),而每次出現(xiàn)重大的科技變革和范式轉(zhuǎn)移時(shí),中國(guó)都是孕育新一代偉大企業(yè)的最好溫床。根據(jù)斯坦福大學(xué)HAI研究院發(fā)布的《2024年人工智能指數(shù)報(bào)告》,2022年中國(guó)在AI領(lǐng)域的專利數(shù)占全球的61.1%,大幅超過(guò)美國(guó)的20.9%。美國(guó)保爾森基金會(huì)Marco Polo智庫(kù)的全球AI人才報(bào)告顯示,中國(guó)在全球頂尖AI學(xué)者的占比從2019年的29%上升到2022年的47%,是人才最豐富的區(qū)域。
中國(guó)在應(yīng)用方面也經(jīng)驗(yàn)豐富,在移動(dòng)互聯(lián)網(wǎng)時(shí)代成功打造了眾多被廣泛使用的明星應(yīng)用,為中國(guó)引領(lǐng)新一波AI原生應(yīng)用的浪潮奠定了堅(jiān)實(shí)的基礎(chǔ)。根據(jù)啟明創(chuàng)投科技投資團(tuán)隊(duì)的統(tǒng)計(jì),2010年以后成立且至今月活躍用戶數(shù)超過(guò)5000萬(wàn)的應(yīng)用,被其定義為“超級(jí)應(yīng)用”,中國(guó)團(tuán)隊(duì)或企業(yè)一共打造了30余個(gè)。對(duì)比而言,美國(guó)團(tuán)隊(duì)或企業(yè)一共打造了7個(gè)。“在互聯(lián)網(wǎng)和移動(dòng)互聯(lián)網(wǎng)時(shí)代中國(guó)已經(jīng)孕育出了眾多科技巨頭,在生成式AI時(shí)代中這一現(xiàn)象必將重現(xiàn)。我相信中國(guó)新一代的偉大的科技公司已經(jīng)在形成中?!敝苤痉逭f(shuō)。