加入星計(jì)劃,您可以享受以下權(quán)益:

  • 創(chuàng)作內(nèi)容快速變現(xiàn)
  • 行業(yè)影響力擴(kuò)散
  • 作品版權(quán)保護(hù)
  • 300W+ 專業(yè)用戶
  • 1.5W+ 優(yōu)質(zhì)創(chuàng)作者
  • 5000+ 長期合作伙伴
立即加入
  • 正文
    • 1.優(yōu)必選聯(lián)合創(chuàng)始人熊友軍:解讀人形機(jī)器人技術(shù)發(fā)展三大趨勢(shì)
    • 2. 銀河通用創(chuàng)始人王鶴:高質(zhì)量數(shù)據(jù)集仍欠缺
    • 3.宇樹科技王興興:人形機(jī)器人是通過AGI最大捷徑
    • 4.星動(dòng)紀(jì)元?jiǎng)?chuàng)始人陳建宇:世界模型與zero-shot泛化能力是未來?
    • 5.加速進(jìn)化程昊:具身智能生態(tài)將包含上萬個(gè)AI Agent
    • 6.哈工大高會(huì)軍:探索類器官如何與機(jī)器智能融合
  • 相關(guān)推薦
  • 電子產(chǎn)業(yè)圖譜
申請(qǐng)入駐 產(chǎn)業(yè)圖譜

誰困住了具身智能?16位人形機(jī)器人高管激辯,戳破行業(yè)真相

12/03 11:50
1132
閱讀需 35 分鐘
加入交流群
掃碼加入
獲取工程師必備禮包
參與熱點(diǎn)資訊討論

作者 |??汪越,編輯?|??心緣

30多位機(jī)器人和具身智能行業(yè)大拿中關(guān)村圍爐談話。

智東西12月2日?qǐng)?bào)道,11月27日,2024年中關(guān)村仿生機(jī)器人大會(huì)在北京海淀舉行,邀請(qǐng)了30多位機(jī)器人和具身智能領(lǐng)域的院士、學(xué)術(shù)專家和企業(yè)家作分享。

他們暢聊了人形機(jī)器人產(chǎn)業(yè)的核心壁壘與落地難點(diǎn),密集輸出數(shù)據(jù)集建設(shè)、系統(tǒng)設(shè)計(jì)、具身智能算法、世界模型、AI Agent、靈巧手操作、應(yīng)用場(chǎng)景與量產(chǎn)時(shí)機(jī)、傳感器、本體感知控制、大腦類器官、人工肌肉、算力資源等諸多熱點(diǎn)干貨。會(huì)上足足有16家明星人形機(jī)器人公司的創(chuàng)始人分別發(fā)表演講或參與圓桌討論。

據(jù)智東西此前統(tǒng)計(jì),今年有33家國內(nèi)人形機(jī)器人創(chuàng)企公布新融資,公開融資總額超過50億元。(人形機(jī)器人融資,爆爆爆!)其中,優(yōu)必選聯(lián)合創(chuàng)始人兼CTO、國家地方共建具身智能機(jī)器人創(chuàng)新中心總經(jīng)理熊友軍分析了未來人形機(jī)器人技術(shù)的三大趨勢(shì)。銀河通用創(chuàng)始人,北京大學(xué)前沿計(jì)算研究中心助理教授、博士生導(dǎo)師,北京智源人工智能研究院具身智能研究中心主任王鶴指出目前高質(zhì)量數(shù)據(jù)集仍欠缺。星動(dòng)紀(jì)元?jiǎng)?chuàng)始人兼CEO陳建宇談到可以通過使用世界模型協(xié)同學(xué)習(xí)來解決數(shù)據(jù)質(zhì)量問題;宇樹科技創(chuàng)始人、CEO、CTO王興興談到機(jī)器人領(lǐng)域應(yīng)采用統(tǒng)一的模型,而不是分裂的多模態(tài)大模型;加速進(jìn)化創(chuàng)始人兼CEO程昊預(yù)測(cè)具身智能將構(gòu)建一個(gè)龐大的AI Agent生態(tài)系統(tǒng),預(yù)計(jì)會(huì)包含上萬個(gè)Agent和百萬級(jí)的開發(fā)者。

帕西尼感知科技創(chuàng)始人兼CEO許晉誠說,人形機(jī)器人過度對(duì)標(biāo)人類的行為導(dǎo)致產(chǎn)品研發(fā)難度極大;月泉仿生創(chuàng)始人兼CEO李天靈、松延動(dòng)力技術(shù)副總監(jiān)覃幫羽都談道,人形機(jī)器人大規(guī)模應(yīng)用的關(guān)鍵障礙之一是產(chǎn)業(yè)鏈不完善;云深處科技聯(lián)合創(chuàng)始人兼CTO李超說,AI將在提升仿生機(jī)器人自適應(yīng)能力和智能水平方面繼續(xù)扮演核心角色。還有一些專注于做人形機(jī)器人靈巧手的創(chuàng)企代表。因時(shí)機(jī)器人創(chuàng)始人兼CEO蔡穎鵬談道,微型化和柔性化將成為未來關(guān)鍵突破點(diǎn),尤其是在小型精密運(yùn)動(dòng)部件的研發(fā)上;靈心巧手聯(lián)合創(chuàng)始人兼CTO周永預(yù)測(cè)未來傳感器的種類將大幅增加,或超過5至10種。

歐洲科學(xué)院院士、哈爾濱工業(yè)大學(xué)交叉科學(xué)研究中心主任高會(huì)軍說,類器官-腦機(jī)接口技術(shù)是未來創(chuàng)新方向;國家優(yōu)青、清華大學(xué)機(jī)械工程系的長聘副教授趙慧嬋重點(diǎn)談到“仿生”技術(shù),認(rèn)為“自清理”機(jī)制是提高人工肌肉壽命的關(guān)鍵創(chuàng)新。千尋智能聯(lián)合創(chuàng)始人高陽、跨維智能創(chuàng)始人賈奎、國訊芯微CTO兼執(zhí)行總裁蔣琛樂聚機(jī)器人合伙人兼副總裁柯真東、青瞳視覺創(chuàng)始人兼CEO張海威靈初智能聯(lián)合創(chuàng)始人柴曉杰、他山科技聯(lián)合創(chuàng)始人兼CEO馬揚(yáng)北京軟體機(jī)器人科技CTO鮑磊,分別分享了他們對(duì)數(shù)據(jù)質(zhì)量、商業(yè)化落地難度、下肢移動(dòng)和靈巧手、材料應(yīng)用和感知技術(shù)等觀點(diǎn)。

1.優(yōu)必選聯(lián)合創(chuàng)始人熊友軍:解讀人形機(jī)器人技術(shù)發(fā)展三大趨勢(shì)

在優(yōu)必選聯(lián)合創(chuàng)始人兼CTO、國家地方共建具身智能機(jī)器人創(chuàng)新中心總經(jīng)理熊友軍的演講中,他分享了人形機(jī)器人產(chǎn)業(yè)的最新進(jìn)展與未來趨勢(shì)。

熊友軍稱,人形機(jī)器人已經(jīng)進(jìn)入產(chǎn)業(yè)化落地階段,市場(chǎng)前景巨大。根據(jù)高盛的報(bào)告,全球人形機(jī)器人市場(chǎng)規(guī)模預(yù)計(jì)從2023年初的60億美元提升至2035年的380億美元,這一增長將主要得益于出貨量的增加和制造成本的降低。預(yù)計(jì)到2035年,人形機(jī)器人的出貨量將達(dá)到140萬臺(tái),且行業(yè)盈利速度將加快。

人形機(jī)器人技術(shù)已有50多年的發(fā)展歷史。2023年以來,海外企業(yè)已開始將人形機(jī)器人應(yīng)用于實(shí)際場(chǎng)景,并計(jì)劃在2025年推出多款產(chǎn)品。國內(nèi)科技公司自2018年開始布局,2023年被視為“人形機(jī)器人元年”,多家公司已發(fā)布產(chǎn)品并進(jìn)入量產(chǎn)階段。

熊友軍談道,未來人形機(jī)器人技術(shù)的發(fā)展呈現(xiàn)三大趨勢(shì):

首先,運(yùn)動(dòng)規(guī)劃與控制技術(shù)正在向深度學(xué)習(xí)和模仿學(xué)習(xí)方法演變。傳統(tǒng)的基于經(jīng)典模型的控制算法和優(yōu)化控制算法,正在被深度強(qiáng)化學(xué)習(xí)等先進(jìn)方法取代,從而提升機(jī)器人的運(yùn)動(dòng)控制能力,尤其是在動(dòng)態(tài)環(huán)境下的自適應(yīng)能力。

其次,數(shù)據(jù)集成為了行業(yè)的核心壁壘。熊友軍強(qiáng)調(diào),機(jī)器人技術(shù)的進(jìn)步離不開高質(zhì)量的數(shù)據(jù)集,尤其是跨模態(tài)融合的數(shù)據(jù)生成體系。這些數(shù)據(jù)集用于訓(xùn)練具身智能體,使機(jī)器人能夠更好地理解和處理現(xiàn)實(shí)世界中的任務(wù)、物體和環(huán)境。因此,建設(shè)機(jī)器人數(shù)據(jù)生成平臺(tái)是一個(gè)行業(yè)方向。

最后,具身智能的新范式是“大腦+小腦”的結(jié)合。具體來說,AI大模型主要負(fù)責(zé)任務(wù)規(guī)劃(“大腦”),例如支持人與機(jī)器的交互,用于寫作、編程、設(shè)計(jì)和辦公等。具身智能體通過數(shù)據(jù)驅(qū)動(dòng)的端到端技能執(zhí)行(“小腦”)來實(shí)現(xiàn)機(jī)器人與物理世界的交互,廣泛應(yīng)用于工業(yè)、商業(yè)、家庭和特種行業(yè)。

2. 銀河通用創(chuàng)始人王鶴:高質(zhì)量數(shù)據(jù)集仍欠缺

北京銀河通用成立于2023年5月,今年累計(jì)融資12億元,以投資方陣容豪華聞名,不僅有美團(tuán)、科大訊飛等科技名企,還有北京、上海、香港、深圳四大地方國資。

其創(chuàng)始人王鶴也是北京大學(xué)前沿計(jì)算研究中心助理教授、博士生導(dǎo)師,北京智源人工智能研究院具身智能研究中心主任。王鶴討論了通用機(jī)器人在多種應(yīng)用場(chǎng)景中的潛力,并分享了當(dāng)前機(jī)器人研發(fā)中的關(guān)鍵進(jìn)展。

目前,主流的機(jī)器人訓(xùn)練數(shù)據(jù)收集方法是通過遙控操作(teleoperation)。這種方法是指人類遠(yuǎn)程控制機(jī)器人,收集不同環(huán)境下的動(dòng)作和感知數(shù)據(jù)。特斯拉等公司通過遙控操作提供了大量的訓(xùn)練數(shù)據(jù)。

此外,谷歌團(tuán)隊(duì)近期開發(fā)了一個(gè)名為OpenVLA的大模型,用于機(jī)器人訓(xùn)練。該模型被設(shè)計(jì)為能夠在不同的環(huán)境、物體和擺放方向下進(jìn)行訓(xùn)練,但現(xiàn)實(shí)中的效果卻不理想,幾乎無法成功抓取物體。王鶴談道,數(shù)據(jù)的不足、雜亂和質(zhì)量不高是導(dǎo)致這一問題的核心原因。

相比自動(dòng)駕駛,機(jī)器人技術(shù)的復(fù)雜性更高,特別是在物理交互方面。為了提高機(jī)器人的適應(yīng)性,訓(xùn)練所需的數(shù)據(jù)不僅需要數(shù)量龐大,還必須具備極高的質(zhì)量。這意味著,機(jī)器人訓(xùn)練的第一步必須從二維視覺提升至三維世界,這樣才能更好地模擬現(xiàn)實(shí)環(huán)境中的物體和場(chǎng)景。然而,單靠傳感器不足以解決這一問題,必須依賴大模型的深度學(xué)習(xí),才能提升機(jī)器人對(duì)復(fù)雜幾何信息的理解。

王鶴進(jìn)一步談道,機(jī)器人抓取動(dòng)作的學(xué)習(xí)至關(guān)重要。通過深度傳感器技術(shù),機(jī)器人能夠更精確地感知周圍環(huán)境和物體的三維信息。深度傳感器通過激光或紅外線等技術(shù)測(cè)量物體與傳感器之間的距離,能夠幫助機(jī)器人準(zhǔn)確感知并理解物體形狀,進(jìn)而做出更有效的抓取動(dòng)作。在這一過程中,機(jī)器人通過監(jiān)督學(xué)習(xí)獲取動(dòng)作標(biāo)簽,從而逐步掌握如何執(zhí)行各種任務(wù),包括精準(zhǔn)抓取。

3.宇樹科技王興興:人形機(jī)器人是通過AGI最大捷徑

宇樹科技成立于2016年,今年B2輪單筆融資額近10億元,是2024年人形機(jī)器人領(lǐng)域單筆融資額最大的公司,投資方包括美團(tuán)、深創(chuàng)投、中國互聯(lián)網(wǎng)投資基金等。

其創(chuàng)始人、CEO、CTO王興興談道,深度強(qiáng)化學(xué)習(xí)算法已在四足機(jī)器人和人形機(jī)器人中得到充分驗(yàn)證,但在手臂和手指操作方面,是否能夠同樣實(shí)現(xiàn)成功應(yīng)用仍是一個(gè)待解的問題。

當(dāng)前,許多機(jī)器人使用觸覺感知來操作三指力控靈巧手,但如果能夠?qū)崿F(xiàn)本體感知控制,就可以避免依賴外部傳感器,從而簡(jiǎn)化操作系統(tǒng)。

關(guān)于運(yùn)動(dòng)控制,王興興說,目前的挑戰(zhàn)是如何通過一個(gè)統(tǒng)一的模型來實(shí)現(xiàn)各種全身運(yùn)動(dòng)?,F(xiàn)有的強(qiáng)化學(xué)習(xí)方法雖然已在仿真環(huán)境中取得一定成效,但其效率仍然較低,且當(dāng)這些算法移植到實(shí)際機(jī)器人上時(shí),由于硬件差異,往往會(huì)產(chǎn)生許多偏差。

王興興還談道,目前許多大語言模型存在幻覺問題,即它們?nèi)狈壿嬎伎寄芰Γ袢俗鰤?mèng)一樣迷失在數(shù)據(jù)海洋中,無法區(qū)分真假和對(duì)錯(cuò)。要實(shí)現(xiàn)具身智能的目標(biāo),必須將強(qiáng)化學(xué)習(xí)與實(shí)際機(jī)器人數(shù)據(jù)相結(jié)合。對(duì)于復(fù)雜的機(jī)器人系統(tǒng)來說,直接用實(shí)物機(jī)器人進(jìn)行機(jī)器學(xué)習(xí)是至關(guān)重要的。

王興興說,當(dāng)前AI模型的最大問題在于缺乏自我理解和學(xué)習(xí)的能力?,F(xiàn)有的AI模型架構(gòu)通常是純數(shù)據(jù)驅(qū)動(dòng)的,即數(shù)據(jù)越多,模型能力越強(qiáng)。但這種方式導(dǎo)致了AI模型的泛化能力較差,難以適應(yīng)新的場(chǎng)景和任務(wù)。王興興設(shè)想了一個(gè)理想中的AI智能模型——一個(gè)能夠自我持續(xù)學(xué)習(xí)、理解、推理的完備模型。這種模型從小數(shù)據(jù)開始,通過持續(xù)的強(qiáng)化學(xué)習(xí),能夠?qū)崿F(xiàn)指數(shù)級(jí)增長和快速學(xué)習(xí)。

在談到世界模型時(shí),他說,這種模型可能實(shí)現(xiàn)了理想中AI的自我迭代能力,并且能使機(jī)器人越來越快速地學(xué)習(xí)和增強(qiáng)能力。此外,行業(yè)未來需要的是統(tǒng)一的模型,而非分裂的多模態(tài)大模型。例如,靈巧手的操作本質(zhì)上與機(jī)器人的導(dǎo)航避障和決策問題類似,完全可以通過一個(gè)統(tǒng)一的模型來實(shí)現(xiàn)。

最后,王興興總結(jié)道,人形機(jī)器人是通往AGI的一條捷徑。當(dāng)前的GPT模型主要處理文本數(shù)據(jù),缺乏足夠的認(rèn)知理解能力。未來,可能需要首先實(shí)現(xiàn)類似動(dòng)物的認(rèn)知理解能力的AI模型,再進(jìn)一步發(fā)展成人類認(rèn)知能力的AI模型。

4.星動(dòng)紀(jì)元?jiǎng)?chuàng)始人陳建宇:世界模型與zero-shot泛化能力是未來?

星動(dòng)紀(jì)元成立于2023年,是一家由清華大學(xué)持股的人形機(jī)器人公司。今年1月,該公司獲得了來自聯(lián)想創(chuàng)投等機(jī)構(gòu)超過億元人民幣的天使輪投資。其創(chuàng)始人陳建宇也是清華大學(xué)交叉信息研究院的助理教授。

陳建宇談道,當(dāng)前的技術(shù)趨勢(shì)是將自然語言處理模型(如ChatGPT)與機(jī)器人技術(shù)結(jié)合,打造“原生”機(jī)器人模型。該模型具有全模態(tài)特點(diǎn),能夠與物理世界進(jìn)行全面的交互,并采用端到端架構(gòu),無需復(fù)雜編程或人類先驗(yàn)知識(shí),從而提高系統(tǒng)的通用性和靈活性。通過這一架構(gòu),具身智能體能夠在簡(jiǎn)潔的算法下實(shí)現(xiàn)規(guī)?;╯caling up)。

在實(shí)現(xiàn)通用具身智能體的過程中,陳建宇強(qiáng)調(diào)了三個(gè)核心要素:本體、算法和數(shù)據(jù)。他說,本體與算法需要聯(lián)合優(yōu)化,而數(shù)據(jù)和算法也應(yīng)通過反饋優(yōu)化,以不斷提升系統(tǒng)性能。此外,本體反饋數(shù)據(jù)進(jìn)一步推動(dòng)優(yōu)化。

關(guān)于數(shù)據(jù),陳建宇說,構(gòu)建通用具身智能體需要大規(guī)模、高質(zhì)量的專門數(shù)據(jù)。GPT-3的訓(xùn)練數(shù)據(jù)已經(jīng)達(dá)到45TB,類似的大規(guī)模數(shù)據(jù)集對(duì)提高機(jī)器人智能至關(guān)重要。除了傳統(tǒng)的文本和圖像數(shù)據(jù),行為、觸覺等來自現(xiàn)實(shí)世界的反饋維度也必不可少,這些數(shù)據(jù)能夠幫助機(jī)器人更好地理解環(huán)境。

在算法方面,陳建宇談道,通用、可擴(kuò)展的具身智能算法研究是關(guān)鍵。像預(yù)測(cè)下一個(gè)Token這樣的算法將是未來具身智能研究的重要方向,能夠在不同情境下做出智能決策。

陳建宇還談道,當(dāng)前的研究通過將大規(guī)模視頻數(shù)據(jù)與機(jī)器人數(shù)據(jù)融合進(jìn)行預(yù)訓(xùn)練,盡管數(shù)據(jù)質(zhì)量仍面臨挑戰(zhàn)。可以通過世界模型協(xié)同學(xué)習(xí)來優(yōu)化數(shù)據(jù)質(zhì)量來解決該問題,從而提升機(jī)器人的感知和理解能力。他還提到了具身智能體的zero-shot泛化能力,即機(jī)器人能夠在沒有預(yù)訓(xùn)練的情況下,處理新的、未知的任務(wù)和環(huán)境。

最后,陳建宇基于機(jī)器人圖靈測(cè)試的概念,提出了一個(gè)問題:機(jī)器人是否能通過圖靈測(cè)試,自動(dòng)執(zhí)行任務(wù)而無需遙控操作?這是他對(duì)機(jī)器人是否能夠具備與人類相似智能的深入思考。

5.加速進(jìn)化程昊:具身智能生態(tài)將包含上萬個(gè)AI Agent

加速進(jìn)化成立于2023 年,今年9月完成了億元Pre-A系列輪融。其團(tuán)隊(duì)核心成員出身于清華機(jī)器人控制實(shí)驗(yàn)室及清華火神足球隊(duì)。其創(chuàng)始人兼CEO程昊在演講中重點(diǎn)討論了具身智能領(lǐng)域的行業(yè)發(fā)展、技術(shù)迭代和開發(fā)者生態(tài)。

程昊談道,移動(dòng)互聯(lián)網(wǎng)的載體是智能手機(jī),而具身智能的終局是人形機(jī)器人。

程昊說,具身智能仍處于初期階段,未來將經(jīng)歷多輪迭代。具體而言,當(dāng)前正處于TPMF(技術(shù)產(chǎn)品匹配)的第一輪產(chǎn)品化階段,雖然許多公司已展示出相關(guān)技術(shù)的Demo,但這些并未轉(zhuǎn)化為實(shí)際落地的產(chǎn)品。現(xiàn)階段,具身智能的應(yīng)用場(chǎng)景主要集中在科研、教育、競(jìng)賽和展覽等領(lǐng)域,并且隨著技術(shù)的發(fā)展,開發(fā)成本正在逐步降低。

在談到具身智能的未來時(shí),程昊分享了他對(duì)具身智能的全景圖構(gòu)想:具身智能將構(gòu)建一個(gè)龐大的AI Agent生態(tài)系統(tǒng),預(yù)計(jì)將包含上萬個(gè)Agent和數(shù)百萬開發(fā)者。這一生態(tài)系統(tǒng)需要強(qiáng)大的端側(cè)支持(設(shè)備端計(jì)算與處理能力)和云側(cè)支持(云端計(jì)算與數(shù)據(jù)存儲(chǔ))。最終的模型可能是基于具身算法,核心是開發(fā)者能夠?qū)⑦@些算法應(yīng)用到機(jī)器人中,使其成為具體的AI Agent。

程昊還談道,開發(fā)者的遷移是具身智能發(fā)展的一個(gè)重要趨勢(shì)。他指出,開發(fā)者將從PC時(shí)代的軟件開發(fā)者、到互聯(lián)網(wǎng)時(shí)代的網(wǎng)站開發(fā)者、再到移動(dòng)互聯(lián)網(wǎng)時(shí)代的APP開發(fā)者,最終遷移到AI時(shí)代的具身開發(fā)者。然而,當(dāng)前具身智能領(lǐng)域仍處于起步階段,開發(fā)者面臨諸多困難,必須首先完善開發(fā)者生態(tài)。隨著開發(fā)平臺(tái)的成熟,更多開發(fā)者將能參與其中,共同推動(dòng)人形機(jī)器人技術(shù)的普及與應(yīng)用。

6.哈工大高會(huì)軍:探索類器官如何與機(jī)器智能融合

在歐洲科學(xué)院院士、哈爾濱工業(yè)大學(xué)交叉科學(xué)研究中心主任高會(huì)軍的演講中,他重點(diǎn)介紹了類器官領(lǐng)域的最新研究進(jìn)展,特別是類器官與腦機(jī)接口的結(jié)合,作為一個(gè)全新的前沿研究課題。近年來,類器官作為體外模擬人體器官功能的生物模型,逐漸成為疾病研究的重要工具,相關(guān)研究成果也頻繁出現(xiàn)在Nature和Science等頂級(jí)期刊上。

目前類器官普遍依賴人工培養(yǎng),且在自然再生過程中存在一致性差、批次效應(yīng)嚴(yán)重和細(xì)胞組成單一等問題。這使得類器官難以實(shí)現(xiàn)標(biāo)準(zhǔn)化批量生產(chǎn),從而限制了其在醫(yī)學(xué)轉(zhuǎn)化中的應(yīng)用。解決這一問題的關(guān)鍵在于如何將類器官的自然再生過程轉(zhuǎn)變?yōu)榭煽氐脑偕^程,這仍然是當(dāng)前研究中的一大難題。

高會(huì)軍談道,類器官再生的研究涉及三個(gè)核心問題:如何對(duì)細(xì)胞進(jìn)行顯微操作、分析類器官再生的機(jī)制、以及如何智能控制類器官的生長過程。針對(duì)這些問題,研究者已將研究領(lǐng)域細(xì)分為多個(gè)方向,包括生物材料合成、類器官芯片、細(xì)胞間通訊機(jī)制等方面。

在未來的研究方向上,類器官將在以下四個(gè)領(lǐng)域引領(lǐng)未來發(fā)展:

1、利用心肌細(xì)胞驅(qū)動(dòng)機(jī)器人,類似于哈佛大學(xué)2022年基于生物組織制造的自發(fā)運(yùn)動(dòng)機(jī)器人。

2、發(fā)展機(jī)器-類器官混合計(jì)算系統(tǒng),探索自然智能與人工智能的融合。

3、AI與自然智能的結(jié)合,利用類器官替代傳統(tǒng)AI實(shí)現(xiàn)類似人類智能的行為。

4、創(chuàng)新的類器官-腦機(jī)接口技術(shù),將類器官作為新的腦機(jī)接口,取代傳統(tǒng)芯片接口,提供更自然的人機(jī)交互體驗(yàn)。

7.清華大學(xué)趙慧嬋:“自清理”機(jī)制提高人工肌肉壽命,感知向力觸和復(fù)雜形狀發(fā)展

在國家優(yōu)青、清華大學(xué)機(jī)械工程系的長聘副教授趙慧嬋的演講中,她探討了軟體機(jī)器人領(lǐng)域的發(fā)展背景、關(guān)鍵技術(shù)進(jìn)展,以及柔性人工肌肉的應(yīng)用。她談道,機(jī)器人發(fā)展已有70多年,但現(xiàn)有機(jī)器人在特殊環(huán)境適應(yīng)和人機(jī)接觸方面仍面臨挑戰(zhàn)。因此,構(gòu)建更加安全、柔順、生物兼容的機(jī)器人本體是軟體機(jī)器人技術(shù)發(fā)展的重要方向。

趙慧嬋介紹了機(jī)器人柔性驅(qū)動(dòng)技術(shù)的三大關(guān)鍵:柔性驅(qū)動(dòng)、外界感知,以及本體設(shè)計(jì)方法與應(yīng)用形態(tài)。

關(guān)于機(jī)器人柔性驅(qū)動(dòng),趙慧嬋說下一代機(jī)器人的驅(qū)動(dòng)器是高性能人工肌肉。人工肌肉作為一種重要的柔性驅(qū)動(dòng)技術(shù),雖然已經(jīng)取得一定進(jìn)展,但但尚未形成工業(yè)化應(yīng)用。挑戰(zhàn)主要在于驅(qū)動(dòng)電壓過高,接近材料的擊穿極限,以及材料的退化和壽命較短。解決方案是,通過電流對(duì)瑕疵點(diǎn)進(jìn)行絕緣,從而確保材料在長時(shí)間使用中的穩(wěn)定性,這被稱為“自清理”機(jī)制。

有了這些核心技術(shù),人工肌肉就能廣泛應(yīng)用于昆蟲級(jí)仿生機(jī)器人、微細(xì)管道的探測(cè)與檢修以及柔性微型隔膜泵等領(lǐng)域。趙慧嬋談道,人工肌肉技術(shù)經(jīng)歷了從低電壓驅(qū)動(dòng)到高功率、高頻率驅(qū)動(dòng),再到多介質(zhì)驅(qū)動(dòng)的發(fā)展。目前,人工肌肉技術(shù)的關(guān)鍵突破之一是新型構(gòu)型的開發(fā)。未來的挑戰(zhàn)包括將人工肌肉技術(shù)應(yīng)用于更極端的環(huán)境,擴(kuò)大制備工藝以實(shí)現(xiàn)大規(guī)模制造,并進(jìn)一步提高技術(shù)的壽命,力求在現(xiàn)有基礎(chǔ)上再提升1至2個(gè)壽命極限。

在感知方面,趙慧嬋談道,過去的研究主要依賴基于光學(xué)原理的柔性光波導(dǎo)技術(shù),使得機(jī)器人能夠感知應(yīng)變、氣壓變化和手指的觸覺力度等信息?,F(xiàn)在,感知技術(shù)的研究正朝著多向力感知發(fā)展。具體而言,新的軟材料被用來制造微小電片,通過這些電片,機(jī)器人可以實(shí)現(xiàn)三向力感知。該技術(shù)可以布置在機(jī)械手指尖或協(xié)作機(jī)械臂的外表面,只需貼上即可實(shí)現(xiàn)感知。

除了力觸感知,趙慧嬋還談到了復(fù)雜形狀感知的進(jìn)展。由于機(jī)器人本體的形狀通常為復(fù)雜的三維結(jié)構(gòu),趙慧嬋稱,利用更先進(jìn)的光學(xué)檢測(cè)技術(shù),機(jī)器人現(xiàn)在能夠?qū)?fù)雜三維形狀進(jìn)行重構(gòu),并實(shí)時(shí)獲取整體的本體形態(tài)。通過這些技術(shù),機(jī)器人不僅能夠感知力的變化,還能更加準(zhǔn)確地了解自身形態(tài)和與環(huán)境的互動(dòng)。

8.圓桌對(duì)話之具身智能:受數(shù)據(jù)、算力限制未來一兩年落地難度大

在圓桌論壇環(huán)節(jié)中,圍繞“AI驅(qū)動(dòng)機(jī)器人進(jìn)入具身智能時(shí)代”這一主題,北京郵電大學(xué)“拔尖人才”教授、中國人工智能學(xué)會(huì)認(rèn)知系統(tǒng)與信息處理專委會(huì)秘書長方斌主持了討論。

與會(huì)嘉賓包括千尋智能聯(lián)合創(chuàng)始人、清華大學(xué)交叉信息學(xué)院博導(dǎo)、清華大學(xué)視覺與具身智能實(shí)驗(yàn)室主任高陽,跨維智能創(chuàng)始人、香港中文大學(xué)(深圳)終身教授賈奎,以及國訊芯微CTO兼執(zhí)行總裁蔣琛。

千尋智能成立于2024年1月,是一家具身智能機(jī)器人研發(fā)商,今年8月完成了2億元天使輪融資,投資方為順為資本;跨維智能成立于2021年6月,是一家以Sim2Real技術(shù)為核心的人工智能企業(yè),今年5月完成了A輪融資,投資方包括聯(lián)想創(chuàng)投,廣州華南理工資管。

高陽首先討論了“scaling law”在具身智能中的應(yīng)用,特別是與數(shù)據(jù)和大語言模型相關(guān)的研究。高陽說,具身智能與大語言模型的最大不同在于,具身智能并沒有無限的數(shù)據(jù)源,因此在構(gòu)建具身智能的“scaling law”時(shí)需要特別考慮這一點(diǎn)。

高陽談道,據(jù)研究,在通用場(chǎng)景中,機(jī)器人只需幾千條數(shù)據(jù)即可實(shí)現(xiàn)任務(wù)的廣泛泛化。這意味著,通過相對(duì)較少的數(shù)據(jù)量,具身智能能夠有效地應(yīng)對(duì)多種任務(wù),表現(xiàn)出較強(qiáng)的適應(yīng)能力和靈活性。

然而,賈奎對(duì)高陽的結(jié)論提出了不同看法。賈奎說,現(xiàn)實(shí)情況遠(yuǎn)比理論推斷復(fù)雜,特別是在不同異構(gòu)數(shù)據(jù)之間存在顯著差異的情況下,幾千條數(shù)據(jù)的量級(jí)并不足以支撐機(jī)器人在復(fù)雜環(huán)境下的任務(wù)泛化。

幾千條數(shù)據(jù)通常屬于一維信號(hào),而在感知層面的復(fù)雜度要高得多,尤其是在信息量較大的情境下,如圖像拍攝或三維數(shù)據(jù)的處理。賈奎說,單憑幾千條數(shù)據(jù)難以實(shí)現(xiàn)數(shù)據(jù)泛化,數(shù)據(jù)量至少要達(dá)到上億條才能有效支持機(jī)器人的智能行為。此外,如何構(gòu)建高效的數(shù)據(jù)管道和工具鏈,降低成本并推動(dòng)應(yīng)用落地,才是當(dāng)前面臨的真正挑戰(zhàn)。

蔣琛從芯片算力的角度談到了具身智能面臨的困難。他說,當(dāng)前的具身智能仍處于非常早期的階段,且面臨著算力限制。對(duì)于VLA模型(超大規(guī)模語言模型)而言,尚不明確該模型需要多少參數(shù),以及哪些數(shù)據(jù)是基于真實(shí)世界的數(shù)據(jù),哪些是基于模擬數(shù)據(jù)。蔣琛談道,現(xiàn)有的算力限制了具身智能的進(jìn)一步發(fā)展,并且預(yù)計(jì)未來1至2年內(nèi),具身智能應(yīng)用落地的實(shí)現(xiàn)難度仍然較大,難以迅速突破。

在討論行業(yè)共識(shí)和共同構(gòu)建數(shù)據(jù)集的問題時(shí),高陽談道,雖然一些基準(zhǔn)測(cè)試(benchmark)已經(jīng)取得了一定進(jìn)展,但機(jī)器人領(lǐng)域尚未形成一個(gè)普遍認(rèn)可的標(biāo)準(zhǔn)基準(zhǔn)。特別是機(jī)器人技術(shù)需要與環(huán)境進(jìn)行交互,因此創(chuàng)建通用的基準(zhǔn)測(cè)試標(biāo)準(zhǔn)非常困難。高陽舉例說,李飛飛教授的行為數(shù)據(jù)集(behavior 100k)就是一種嘗試,或許可以通過提升指標(biāo)和進(jìn)行算法比較來推動(dòng)這一領(lǐng)域的研究進(jìn)展。

賈奎補(bǔ)充道,在不同硬件環(huán)境下的機(jī)器人系統(tǒng),模擬和真機(jī)之間的差異使得標(biāo)準(zhǔn)化和比較變得困難。當(dāng)前的研究應(yīng)多做嘗試,并加大投入,以推動(dòng)技術(shù)的進(jìn)步。

蔣琛從數(shù)據(jù)質(zhì)量出發(fā),談到了只有在高質(zhì)量數(shù)據(jù)集的支持下,機(jī)器人系統(tǒng)才能實(shí)現(xiàn)有效的標(biāo)準(zhǔn)化。當(dāng)前,數(shù)據(jù)集的來源尚未標(biāo)準(zhǔn)化,這導(dǎo)致了后續(xù)的標(biāo)準(zhǔn)化工作變得困難,無法形成統(tǒng)一的基準(zhǔn)測(cè)試。此外,現(xiàn)在的運(yùn)動(dòng)捕捉(動(dòng)捕)數(shù)據(jù)等可能并非高質(zhì)量數(shù)據(jù),未來大概率會(huì)被淘汰,但它們目前占用了大量的GPU算力。蔣琛補(bǔ)充道,將高質(zhì)量數(shù)據(jù)集的采集作為核心研究命題,解決數(shù)據(jù)質(zhì)量問題是推動(dòng)具身智能發(fā)展的關(guān)鍵。

9.圓桌對(duì)話之人形機(jī)器人:靈巧手是突破關(guān)鍵,多重挑戰(zhàn)阻礙發(fā)展

在山東大學(xué)教授、博士生導(dǎo)師張偉的主持下,樂聚機(jī)器人合伙人兼副總裁柯真東、青瞳視覺創(chuàng)始人兼CEO張海威、帕西尼CEO許晉誠、月泉仿生CEO李天靈,以及松延動(dòng)力技術(shù)副總監(jiān)覃幫羽,圍繞當(dāng)前人形機(jī)器人研發(fā)的技術(shù)突破、瓶頸問題以及未來商業(yè)化落地展開了深入討論。

青瞳視覺創(chuàng)立于2015年,專注于3D智能感知和人機(jī)交互系統(tǒng)的研發(fā);帕西尼成立于2021年,是一家觸覺傳感器和人形機(jī)器人公司,今年5月已完成數(shù)億元A輪及A1輪融資,投資方包括新奧資本、北汽產(chǎn)投、南山戰(zhàn)新投等機(jī)構(gòu)。

在談到當(dāng)前階段人形機(jī)器人技術(shù)的重點(diǎn)時(shí),與會(huì)嘉賓普遍認(rèn)為,上半身的靈巧操作更加重要。覃幫羽談道,大部分應(yīng)用場(chǎng)景下,機(jī)器人手部的抓取和操作是核心任務(wù),而下半身的移動(dòng)則更依賴于具體場(chǎng)景的需求。李天靈說,雖然雙足機(jī)器人移動(dòng)仍面臨高能耗問題,但在實(shí)現(xiàn)目標(biāo)時(shí),機(jī)器人手部的靈巧操作才是突破的關(guān)鍵。

許晉誠也說,雖然下肢的選擇性較多,但上肢的通用工具能力才是推動(dòng)機(jī)器人廣泛應(yīng)用的關(guān)鍵因素。張海威稱,復(fù)雜環(huán)境下任務(wù)完成的關(guān)鍵仍然是雙手,靈巧手加遙操作將是未來的核心技術(shù)方案。柯真東談道,隨著技術(shù)發(fā)展,移動(dòng)不再是限制因素,未來的重心可能會(huì)轉(zhuǎn)向極限應(yīng)用場(chǎng)景中對(duì)下肢移動(dòng)的需求。

討論進(jìn)一步聚焦到當(dāng)前人形機(jī)器人研發(fā)中的最大技術(shù)瓶頸。柯真東說,當(dāng)前最大的問題是缺乏足夠的高質(zhì)量數(shù)據(jù),尤其是用于泛化操作的數(shù)據(jù)來源存在較大爭(zhēng)議。隨著技術(shù)的不斷進(jìn)步,這一瓶頸可能會(huì)被突破,但現(xiàn)階段數(shù)據(jù)問題仍然困擾著研發(fā)。

張海威談道,產(chǎn)業(yè)化目標(biāo)下的最大挑戰(zhàn)是可用性、成本和續(xù)航問題,首要任務(wù)是解決機(jī)器人的可操作性和泛化能力。

許晉誠談道,人形機(jī)器人與人類進(jìn)行對(duì)標(biāo)的挑戰(zhàn)很大,產(chǎn)品定義的不明確使得這一對(duì)標(biāo)困難重重,未來需要更加收斂的設(shè)計(jì)方向。李天靈補(bǔ)充道,科研突破到工程化應(yīng)用的轉(zhuǎn)化過程中,材料選擇與供應(yīng)鏈的問題是難點(diǎn)。覃幫羽說,除了數(shù)據(jù)問題,算法的部署與硬件一致性、電池能源問題也是制約技術(shù)發(fā)展的瓶頸,此外,產(chǎn)業(yè)鏈尚未成熟,成本依舊高昂。

在討論到未來5年人形機(jī)器人商業(yè)化的落地及行業(yè)爆發(fā)點(diǎn)時(shí),柯真東談道,當(dāng)前機(jī)器人最有潛力的應(yīng)用場(chǎng)景仍然是科研領(lǐng)域,工業(yè)應(yīng)用也在逐步落地,但要達(dá)到理想的投入產(chǎn)出比(ROI),還需要時(shí)間。他預(yù)計(jì),隨著數(shù)據(jù)能力和作業(yè)效率的提升,機(jī)器人將在服務(wù)行業(yè)和家庭場(chǎng)景中逐漸嶄露頭角,但具體量產(chǎn)的時(shí)機(jī)尚不明朗。

張海威說,由于工業(yè)場(chǎng)景的應(yīng)用要求較高,而家庭生活場(chǎng)景的需求體量更龐大,因此未來人形機(jī)器人在家庭中的應(yīng)用前景更為廣闊。許晉誠稱,產(chǎn)業(yè)應(yīng)用將率先取得突破,特別是在規(guī)則明確的場(chǎng)景中,而家庭場(chǎng)景的挑戰(zhàn)則主要來源于對(duì)機(jī)器人的評(píng)價(jià)標(biāo)準(zhǔn)問題。

李天靈談道,目前人形機(jī)器人在工業(yè)場(chǎng)景中已有應(yīng)用,不過終極目標(biāo)仍是進(jìn)入家庭,尤其是在陪護(hù)等領(lǐng)域的需求逐漸明確。覃幫羽說,人形機(jī)器人和工業(yè)機(jī)器人存在本質(zhì)差異,人形機(jī)器人難以替代大部分工業(yè)機(jī)器人應(yīng)用,但其在家庭陪護(hù)等領(lǐng)域的潛力巨大,短期內(nèi)可以從娛樂導(dǎo)覽和科研教育等場(chǎng)景入手。

10.圓桌對(duì)話之仿生機(jī)器人:三大技術(shù)創(chuàng)新趨勢(shì),傳感器或?qū)⒊^10種

在這場(chǎng)圓桌論壇中,多個(gè)專家圍繞仿生機(jī)器人技術(shù)的發(fā)展現(xiàn)狀與未來趨勢(shì)進(jìn)行了探討。論壇由南京航空航天大學(xué)教授、神源生智能董事長戴震東主持,參與的嘉賓包括云深處科技聯(lián)合創(chuàng)始人兼CTO李超、因時(shí)機(jī)器人CEO蔡穎鵬、靈心巧手CTO周永、靈初智能聯(lián)合創(chuàng)始人柴曉杰、他山科技聯(lián)合創(chuàng)始人兼CEO馬揚(yáng)和北京軟體機(jī)器人科技CTO鮑磊。

云深處科技成立于2017年,是一家四足仿生機(jī)器人研發(fā)商;因時(shí)機(jī)器人成立于2016年,提供機(jī)器人核心零部件以及整機(jī)解決方案;靈初智能成立于2024年,致力于打造通用操作智能體;他山科技成立于2017年,是一家人工智能觸覺傳感芯片創(chuàng)企。

在討論單元模塊的技術(shù)創(chuàng)新時(shí),蔡穎鵬提出了微型化、一體化和柔性化(力控)三個(gè)發(fā)展趨勢(shì)。他補(bǔ)充道,底層技術(shù)的創(chuàng)新是關(guān)鍵,尤其是在如何將不同領(lǐng)域的技術(shù)痛點(diǎn)統(tǒng)一方面,例如小型化精密部件的研發(fā)。

關(guān)于感知與機(jī)械手的關(guān)系,周永說,機(jī)械手本質(zhì)上只是一個(gè)載體,所有的智能操作都依賴于感知技術(shù)。他談道,未來仿生機(jī)器人將采用多種傳感器進(jìn)行數(shù)據(jù)采集,目前的主要技術(shù)路線有兩種:一是側(cè)重力傳感的自動(dòng)化路線,二是側(cè)重視覺感知。周永預(yù)測(cè),未來傳感器將大量應(yīng)用,種類或超過5至10種。

在材料應(yīng)用方面,柴曉杰談道,高性能材料(如碳纖維和高強(qiáng)度硅膠)可以減少機(jī)器人在復(fù)雜應(yīng)用中的誤操作和碰撞風(fēng)險(xiǎn),提高安全性,并降低生產(chǎn)成本。此外,觸覺傳感器的性能也與材料的選擇息息相關(guān),良好的材料可以提升觸覺反饋的穩(wěn)定性和靈敏度,從而改善機(jī)器人在實(shí)際場(chǎng)景中的表現(xiàn)。

關(guān)于觸覺傳感技術(shù),馬揚(yáng)談道,觸覺傳感與視覺傳感的最大區(qū)別在于其需要更高密度的傳感器布置,依賴快速反應(yīng)和高精度感知。當(dāng)前,觸覺傳感的前端技術(shù)面臨的主要挑戰(zhàn)是如何在硬件層面提供支持,尤其是在邊緣計(jì)算中實(shí)現(xiàn)高效的數(shù)據(jù)處理。

在未來技術(shù)發(fā)展上,李超預(yù)測(cè),AI將在仿生機(jī)器人中繼續(xù)扮演重要角色,推動(dòng)機(jī)器人的自適應(yīng)能力和智能水平進(jìn)一步提升。蔡穎鵬說,微型化和柔性化將成為未來技術(shù)突破的關(guān)鍵,尤其是在精密小型運(yùn)動(dòng)部件的開發(fā)上。馬揚(yáng)談道,觸覺技術(shù)與力控技術(shù)將在醫(yī)療、家居和工業(yè)自動(dòng)化等領(lǐng)域的精細(xì)操作中發(fā)揮重要作用。

11.結(jié)語:機(jī)器人行業(yè)尚未形成共識(shí)

數(shù)據(jù)量和數(shù)據(jù)質(zhì)量的不足被廣泛認(rèn)為是制約機(jī)器人在復(fù)雜環(huán)境中實(shí)現(xiàn)任務(wù)泛化的主要障礙。雖然關(guān)于機(jī)器人泛化所需的具體數(shù)據(jù)量級(jí)仍存在不同看法,但建設(shè)高質(zhì)量的數(shù)據(jù)集已成為行業(yè)的共識(shí)。此外,芯片算力的局限性也限制了機(jī)器人廣泛應(yīng)用的可能性。而在軟體機(jī)器人領(lǐng)域,力控感知和復(fù)雜形狀感知已成為研究的關(guān)鍵方向。目前,機(jī)器人行業(yè)的各家公司,無論是專注硬件、軟件,還是深度學(xué)習(xí)或大模型的研發(fā),都面臨著方法論和數(shù)據(jù)集不統(tǒng)一的問題。這一現(xiàn)象與ChatGPT等AI應(yīng)用不同,機(jī)器人不僅涉及復(fù)雜的硬件設(shè)計(jì),還需應(yīng)對(duì)與物理環(huán)境交互的適應(yīng)性和智能化問題。

(本文系網(wǎng)易新聞?網(wǎng)易號(hào)特色內(nèi)容激勵(lì)計(jì)劃簽約賬號(hào)【智東西】原創(chuàng)內(nèi)容,未經(jīng)賬號(hào)授權(quán),禁止隨意轉(zhuǎn)載。)

相關(guān)推薦

電子產(chǎn)業(yè)圖譜