作者 |??程茜,編輯?|??漠影
AI時代進(jìn)入下半場,具身智能顛覆生產(chǎn)力。
今年初,家用機器人Mobile ALOHA火爆出圈,炒菜、洗碗、掃地、逗貓、疊衣服樣樣精通,堪稱全能管家;時隔半年,原班團(tuán)隊再度推出機器人自主導(dǎo)航基礎(chǔ)模型Mobility VLA,機器人在公司轉(zhuǎn)一圈就能聽從人類語音指令,快速變身導(dǎo)航員。
像這樣逐漸深入我們生活的機器人越來越多,做咖啡、打掃衛(wèi)生、酒店配送,甚至連按摩、作手術(shù)、康復(fù)訓(xùn)練等諸多崗位上都出現(xiàn)了機器人的身影。
但即便如此,這些機器人也只是按部就班、聽命行事,距離電影中高度智能的機器人形象仍相距甚遠(yuǎn)。
AI技術(shù)革命,并非一蹴而就,橫空出世,而是在科技?xì)v史長河中持續(xù)地發(fā)生。2022年底,以生成式人工智能 ChatGPT為起點的大語言模型(LLM),帶來人機對話交互變革。2024年,LAM(大型動作模型)正在起勢,機器人覺醒新紀(jì)元來臨。
具身智能已經(jīng)在實際場景中落地應(yīng)用,重構(gòu)了生產(chǎn)關(guān)系,對生產(chǎn)力起到了顛覆意義,正在助推著新工業(yè)革命??梢哉f,AI為科幻電影中具有高度智能的機器人走出銀幕搭起了階梯。
作為新質(zhì)生產(chǎn)力代表的具身智能聯(lián)想晨星足式機器人GS應(yīng)運而生,這也是大模型與物理世界交互的最領(lǐng)先成果之一,作用于現(xiàn)實世界,具身智能具有更深遠(yuǎn)的意義和影響。伴隨2024/2025財年Q1財報,聯(lián)想集團(tuán)發(fā)布第三季硬核知識科普視頻的第一集《具身智能:人工智能如何成為人》。
視頻中采用了桌面電影形式的融合創(chuàng)新。極具《權(quán)力的游戲》風(fēng)格的開場片頭,以串聯(lián)著機器人領(lǐng)域完整技術(shù)發(fā)展關(guān)系圖譜的科技樹為線索,帶領(lǐng)觀眾在時間中穿梭,重新探索機器人科技樹圖譜下三個技術(shù)路徑的競技與角逐。在講述中同時打碎重構(gòu)桌面元素,讓信息在觀眾、主角IP和桌面中流動傳遞。
此外,視頻中以英國科技?xì)v史學(xué)家、生物化學(xué)家、中科院外籍院士李約瑟為原型打造的智能體,也是一大亮點。立足于2100年的賽博版李約瑟,以未來的第一人稱視角首次為觀眾呈現(xiàn)具身智能完整的技術(shù)史觀,也在其中展示了新工業(yè)革命時代的革命先鋒——聯(lián)想晨星足式機器人GS如何深入工業(yè)場景,看到聯(lián)想集團(tuán)使AI向?qū)?,幫助千行百業(yè)真正應(yīng)用AI,釋放生產(chǎn)力還智于業(yè),完成變革,可謂是一支帶有十足革命感和大歷史觀的視頻大片。
01.百年技術(shù)角逐碰撞喚醒具身智能機器人
1959年,世界上第一臺機器人Unimate被安裝在汽車工廠的裝配線上,彼時其只能完成輔助汽車生產(chǎn)的簡單、重復(fù)任務(wù);60余年后,各種類人、足式機器人出現(xiàn),大型商超、工業(yè)園區(qū)的巡邏安防、全天候的電力巡檢、消防應(yīng)急救援、做咖啡等諸多場景都出現(xiàn)了機器人的身影。
與機器人形態(tài)發(fā)展的前提是技術(shù)的進(jìn)階,隨著各項能力被慢慢點亮,機器人科技樹逐漸枝繁葉茂。
從聯(lián)想集團(tuán)財報視頻打造的科技樹起點可看到,最先點亮機器人應(yīng)用能力的是工業(yè),在第一臺機械手臂Unimate所在的技術(shù)路徑上,數(shù)控技術(shù)、工業(yè)機器人、機械手臂等技術(shù)被點亮。
在此之上,斯坦福大學(xué)研究人員發(fā)明的Stanford Arm擁有6個自由度,奠定了工業(yè)機器人的標(biāo)準(zhǔn)化基礎(chǔ)。20世紀(jì)70年代初期,第一臺由電動機驅(qū)動的工業(yè)機器人FAMULUS問世,ABB機器人(原ASEA)推出IRB 6,世界上首臺全電動微型處理器控制的機器人發(fā)布,使得工業(yè)機器人發(fā)展飛速,科技樹的這一支線也走向成熟。
但機器人的形態(tài)就穩(wěn)固于此了嘛?機器人科技樹發(fā)展的第二條技術(shù)路徑給出了答案。在“工業(yè)”技術(shù)路徑發(fā)展初期,機器人另一條技術(shù)路徑也開始萌芽——“移動”。
這條技術(shù)路徑中最直觀的變化就是機器人形態(tài)。1970年前后,美國斯坦福國際研究所開發(fā)了首臺移動機器人Shakey,它可以做到自主感知、環(huán)境建模、行動規(guī)劃并執(zhí)行任務(wù),不過當(dāng)時受限于計算機體積以及運算速度,Shakey往往需要耗費數(shù)個小時完成任務(wù)。
機器人在移動領(lǐng)域的技術(shù)節(jié)點被點亮,并且實現(xiàn)了與工業(yè)機器人技術(shù)路徑的交叉。這些貫穿著前后數(shù)十年歷程的技術(shù)節(jié)點,鑄成了機器人“覺醒之門”的鑰匙,成為讓機器人走出工廠、走進(jìn)家庭、商場等場景的關(guān)鍵技術(shù)支持。
科技樹的第三條支線“智能與神經(jīng)”迎來爆發(fā),這也正是打造出能滿足人們對機器人終極幻想的關(guān)鍵條件。
1950年,內(nèi)置光傳感器、觸摸傳感器、推進(jìn)及轉(zhuǎn)向電機的電子烏龜誕生,可以摸索著向有光亮的地方前進(jìn),并在遇到障礙時改變方向,使得機器人展現(xiàn)出了擁有“生物智慧”的潛力。直到2016年,一場AlphaGo戰(zhàn)勝李世石的世紀(jì)決戰(zhàn),成為機器人發(fā)展的標(biāo)志性時刻。
在智能與神經(jīng)與工業(yè)、移動三支技術(shù)支線相互碰撞的時刻,早在1950年就已經(jīng)被提出的智能體、具身智能概念,今年終于展現(xiàn)出了成為現(xiàn)實的可能。
2.嵌入大模型與體驗聯(lián)想具身智能“上崗”三大場景
如今“以機器人之軀,承載AI的靈魂”,已成為當(dāng)下這一產(chǎn)業(yè)的熱門議題。
智慧最先只出現(xiàn)在虛擬世界當(dāng)中。
早年間,DeepMind連發(fā)三篇論文,闡釋了通過機器學(xué)習(xí)教導(dǎo)AI自主學(xué)習(xí)走路;OpenAI基于強化學(xué)習(xí)讓智能體掌握了各種捉迷藏套路,并掌握了多種隱藏策略。后來,麻省理工學(xué)院的研究小組基于機器學(xué)習(xí)技術(shù),讓“粘液”機器人具備了改變形狀完成復(fù)雜任務(wù)的潛力,于是大模型和物理世界產(chǎn)生連接。
這就是視頻中提到的“離身智能”,視頻中呈現(xiàn)的這場1963年的實驗,說明了“離身智能”與“具身智能”的關(guān)鍵區(qū)別。
實驗中籠子里的兩只貓,一只可以主動正常行走,另一只只能被動行走,最后的結(jié)果是被動行走的貓無法應(yīng)用對環(huán)境深度感知的能力。
因此,實現(xiàn)具身智能最關(guān)鍵的就是自主感知、親身體驗,這也是擴(kuò)寬機器人在產(chǎn)業(yè)場景中應(yīng)用空間的先決條件。
機器人此前被應(yīng)用于具體場景時,往往只能依賴于在軟件中學(xué)習(xí)的經(jīng)驗,或者僅完成簡單的重復(fù)性任務(wù)。但對于危險系數(shù)高的環(huán)境、人不方便進(jìn)入的狹窄危險區(qū)域而言,機器人需要更高的智能屬性,才能應(yīng)對這些場景,并真正輔助人類完成任務(wù)。
正如我們在視頻中看到,從科技樹中具身智能這一節(jié)點走進(jìn)現(xiàn)實的還有聯(lián)想晨星足式機器人GS,就是當(dāng)下機器人承載AI靈魂,并能真正滿足企業(yè)對于新質(zhì)生產(chǎn)力的急迫需求的集大成者。
聯(lián)想集團(tuán)要做的是真正讓懂人話、會規(guī)劃的機器人走出實驗室,落地到場景中——還智于業(yè)。
聯(lián)想晨星足式機器人GS已經(jīng)從單純的聽令行事,演進(jìn)為可通過理解自然語言執(zhí)行復(fù)雜任務(wù),且能夠自主糾錯應(yīng)對特殊情況。
根據(jù)面對開放動態(tài)環(huán)境提出的具身導(dǎo)航框架,機器人可以基于大語言模型理解自然語言指令,將復(fù)雜指令分解成不同的動作序列,然后機器人基于狀態(tài)、任務(wù)需求協(xié)調(diào)動作網(wǎng)絡(luò)。
在執(zhí)行任務(wù)、規(guī)劃行走路徑時,機器人通過大模型和長短記憶可以推測目標(biāo)方位,從而結(jié)合3D語義地圖給出的物體關(guān)系對制定目標(biāo)進(jìn)行搜尋。
此外,聯(lián)想集團(tuán)還利用了生成式AI建立典型場景的隨機環(huán)境并加入物理引擎,采用強化學(xué)習(xí)訓(xùn)練機器人行走和探索,優(yōu)化探索策略。
在形態(tài)的設(shè)計方面,聯(lián)想晨星足式機器人GS也始終服務(wù)于落地應(yīng)用這一終極目標(biāo)。
不同于常見的四足設(shè)計,它基于六足實現(xiàn)了三角靜態(tài)穩(wěn)定步態(tài),擁有能應(yīng)對全地形的移動能力,爬樓梯、過斜坡、穿越崎嶇路面都不在話下。
另外,運動過程中的穩(wěn)定,也能保證搭載在其之上的傳感器采集到的圖像清晰、穩(wěn)定、一致性強,并能減少磕碰,延長使用壽命。
同時,機器人實際應(yīng)用場景中為了完整復(fù)雜任務(wù)往往需要搭載機械臂輔助完成,但受限于穩(wěn)定性等因素,人形、四足機器人等可搭載的機械臂重量有限,而聯(lián)想晨星足式機器人GS負(fù)載能力達(dá)到100公斤級,因此在實際場景中的應(yīng)用空間更大。
工業(yè)巡檢操作、應(yīng)急救援支持、野外勘測任務(wù)這三大場景則成為其率先落地應(yīng)用的任務(wù)。
在工業(yè)巡檢操作中,聯(lián)想晨星足式機器人GS可以實現(xiàn)自主巡檢、定位故障、收集數(shù)據(jù),以提供工業(yè)設(shè)備的運行效率和安全性。應(yīng)急救援支持時,會遇到一些極端天氣,達(dá)到IP66防水等級的足式機器人可以在災(zāi)難現(xiàn)場快速響應(yīng),實現(xiàn)救援搜救、物資運輸?shù)热蝿?wù)。面對野外地形勘探任務(wù),它還能實現(xiàn)高效精準(zhǔn)的地形測繪、資源勘探、環(huán)境監(jiān)測。
還有,聯(lián)想投資的清華系機器人創(chuàng)企星動紀(jì)元,已經(jīng)成長為國內(nèi)人形機器人產(chǎn)業(yè)的代表企業(yè),開發(fā)了具身智能人形機器人全棧技術(shù)架構(gòu),推出了全尺寸人形機器人XBOT。在不依賴預(yù)先編程和遙控操作的情況下,XBOT能完成全自主任務(wù)實現(xiàn)和規(guī)劃導(dǎo)航。
此外,人形機器人Figure 02也開始“進(jìn)廠打工”。不僅外形更像人,還能實現(xiàn)與人類語音對話。Figure 02可直接作用于汽車工廠的生產(chǎn)制造環(huán)境,已具備執(zhí)行通常對人類工人具有挑戰(zhàn)性的復(fù)雜任務(wù)的能力,如將鈑金件插入特定固定裝置這一汽車底盤組裝中的關(guān)鍵步驟。
這一刻機器人的技術(shù)革命與場景應(yīng)用的成果已經(jīng)達(dá)到了新的階段,人形、足式、輪式以及各類仿生形態(tài)的機器人落地到工業(yè)場景中,打通物理與信息世界邊界的標(biāo)志性時刻到來。
3.聯(lián)想集團(tuán)使AI向?qū)?/strong>為生產(chǎn)力變革注入強勁動力
聯(lián)想集團(tuán)首款晨星機器人到如今的晨星足式機器人GS,在形態(tài)、能力變遷中已經(jīng)變?yōu)榱艘慌_擁有感知、思考和行動能力的智能體。
可以說,聯(lián)想晨星足式機器人GS是前沿技術(shù)與落地應(yīng)用,在當(dāng)下這一發(fā)展節(jié)點碰撞出的必然成功。
再看視頻中的科技樹,其技術(shù)延展的進(jìn)程正在從終身智能、情感智能、倫理與公平到仿生手指,讓這些人類曾賦予無限想象空間的智能體將成為現(xiàn)實。
或許在未來某個時刻,伴隨著機器人科技樹枝椏繼續(xù)延伸,最終的智能體將與人的形象接近重合,從而實現(xiàn)技術(shù)狂想與現(xiàn)實世界的交織。
AI領(lǐng)域的技術(shù)突破與落地應(yīng)用的研究一直齊頭并進(jìn),人工智能革命正在發(fā)生,我們親身感知到的,或許只是其中分支,而具身智能在新工業(yè)革命中有著更深遠(yuǎn)的意義和影響。聯(lián)想集團(tuán)董事長兼CEO楊元慶說道,聯(lián)想集團(tuán)要做的就是:“讓人工智能走下云端,真正落地,走進(jìn)千家萬戶千行百業(yè)。”
聯(lián)想集團(tuán)實現(xiàn)機器人從輔助決策、能力增強到實現(xiàn)產(chǎn)業(yè)應(yīng)用落地的變遷。使AI向?qū)?,推動了AI社會的進(jìn)程,讓AI與千行百業(yè)緊密連接。
真正的AI時代應(yīng)該基于以人為本、多元豐富的智能技術(shù)理念,將效率優(yōu)勢和創(chuàng)新優(yōu)勢兼收并蓄,釋放個體的創(chuàng)造力和生產(chǎn)力,使經(jīng)濟(jì)與社會發(fā)展的動能倍增,從而構(gòu)建人本智能的璀璨未來。聯(lián)想正圍繞著“Smarter AI for all” 的愿景,催化助力AI落地應(yīng)用。