明敏 發(fā)自 凹非寺,量子位 | 公眾號 QbitAI
想體驗今年大火的空間計算,不用等蘋果了。
喏,手指一捏,空間搜索馬上開啟,各類內(nèi)容一下子在眼前鋪開。
只需轉(zhuǎn)轉(zhuǎn)頭,就能看到更多內(nèi)容。
眼睛聚焦在哪個卡片上,都能被選中突出。
通過語音即可輸入搜索關(guān)鍵字,搜索結(jié)果仿佛從遠(yuǎn)處空間沖過來的一樣。
而且感興趣的內(nèi)容被會放在最容易被注意的地方。
最后大手一揮,就能關(guān)閉界面。
蕪湖~把搜索放到3D空間里之后,交互方式、信息排布等,完全不一樣了。
界面從小屏擴(kuò)展成了整個眼前的“幕布”,能放入更多信息。
呈現(xiàn)內(nèi)容的方式徹底打破了2D局限,不同窗口的空間深度不同,更加直觀表示了信息的優(yōu)先級。
打開界面的方式也更加自然簡單,手、頭、眼配合即可搞定。
沒想到,今年搜索引擎不僅要被AI變革,還要被AR變革。
如上效果,就是由一臺AR眼鏡+一臺AR主機(jī)實(shí)現(xiàn)的,它們組合之后,開始被稱為“空間計算機(jī)”,能把計算機(jī)的功能放到虛實(shí)結(jié)合的世界里。
而且它離我們并不遙遠(yuǎn),目前已經(jīng)實(shí)現(xiàn)量產(chǎn),已知發(fā)售比Vision Pro更早。
價格嘛,也更加親民了一些,只需8998元。
不過話說回來,AR眼鏡組合AR主機(jī)不是新鮮事物了。
為什么這一回,可以稱得上是“空間計算機(jī)”?
率先實(shí)現(xiàn)單攝SLAM交互
如上提到了AR眼鏡和AR主機(jī),是一個AR空間計算套組Rokid AR Studio,為Rokid最新發(fā)布的新品:
- Rokid Max Pro
- Station Pro
和蘋果Vision Pro走的VST(視頻透視)路線不同,這臺“空間計算機(jī)”屬于OST(光學(xué)透視),簡單理解就是能通過眼鏡看到真實(shí)的現(xiàn)實(shí)世界。
Rokid Max Pro是Rokid最新一代AR眼鏡,重量為76g,僅有一個攝像頭。
其背后計算能力的支持,主要來自Station Pro。
該主機(jī)搭載高通第一代驍龍XR2+,相較于驍龍XR2,它能將續(xù)航提升50%,散熱提升30%。
由此,Station Pro續(xù)航能力是手機(jī)方案的2倍以上,可以達(dá)到厘米級6DoF跟蹤精度和極低MTP(Motion to Photon)渲染延遲。
二者結(jié)合后,主要關(guān)注的便是在空間、計算兩方面,帶來新體驗。
其一是在空間維度力求更加自然的信息交互。
比如現(xiàn)在,抬抬胳膊就能擁有一塊電子虛擬手表。
握住拳頭,手表就會切換界面,顯示天氣溫度。
而且手表上的信息是立體的,手腕轉(zhuǎn)動后,表盤上的內(nèi)容隨之轉(zhuǎn)動,而且呈現(xiàn)內(nèi)容也會變成3D模式。
如果放下胳膊,手表就會消失;轉(zhuǎn)動視角,面前的屏幕也不會移動。
這種信息交互呈現(xiàn)方式,不會讓人覺得脫離物理世界,好像只是把電腦、手表虛擬化了,感覺更加逼近人們本來的交互習(xí)慣。
在游戲場景下,能實(shí)現(xiàn)360度全方位沉浸式打怪,捏住手指即可發(fā)出攻擊。
以及前面提到的空間搜索,一下子把搜索引擎升維,變成了3D的感覺。
所有內(nèi)容在眼前鋪開,通過排布位置、深度信息體現(xiàn)主次。
甚至都不需要鼠標(biāo)、鍵盤這些工具了,動動嘴即可開啟搜索,轉(zhuǎn)轉(zhuǎn)頭和眼睛,就能鎖定想找的內(nèi)容。這些也都是人們?nèi)粘I罾镒钭匀坏慕换シ绞健?/p>
其二是在計算維度,Rokid Max Pro+Station Pro確實(shí)更像計算機(jī)了。
首先在界面顯示上,可以支持多個窗口并列排布,但是是3D的,也就是把周圍環(huán)境都變成桌面。
這樣一來,轉(zhuǎn)轉(zhuǎn)頭即可看到另一個窗口,也讓AR呈現(xiàn)“不再只是一塊更大屏幕”。
其次在處理能力上,Station Pro搭載12G RAM+128G ROM,能支持十余個任務(wù)并行,幾乎和日常在電腦上處理的任務(wù)量相當(dāng)。
最后在續(xù)航方面,Rokid Max Pro+Station Pro能實(shí)現(xiàn)5-6小時續(xù)航,和一臺Windows辦公本水平相當(dāng)。
值得一提的是,以上所有效果,都是基于單攝SLAM方案實(shí)現(xiàn),要知道目前業(yè)內(nèi)諸多產(chǎn)品都還是采用雙攝、多攝。
創(chuàng)新性地把攝像頭數(shù)量壓縮到僅剩一個,能讓AR眼鏡的功耗更低、結(jié)構(gòu)更簡單、成本更低,由此也能讓實(shí)際佩戴更加舒適、價格更實(shí)惠。
但單目方案也給技術(shù)提出更高要求,因為它無法得到絕對的尺度信息,需要通過初始化恢復(fù)尺度信息,而初始化的好壞直接影響算法的最終精度。
Rokid利用IMU輔助、濾波算法、SLAM算法等,通過軟件方面的加持,最終率先為行業(yè)帶來了單攝SLAM方案,進(jìn)而推動行業(yè)向前發(fā)展。
綜上,從空間和計算兩個維度出發(fā),Station Pro組合Rokid Max Pro,打破了人們對AR的一些既往認(rèn)知:只是一塊更大的屏幕、交互體驗偏傳統(tǒng)……
這些效果實(shí)現(xiàn)的背后,既得益于底層硬件的能力進(jìn)階,也離不開廠商本身對虛實(shí)結(jié)合、人機(jī)交互的深刻理解和嘗試。
由此官方直接將Station Pro+Rokid Max Pro定義為一臺“空間計算機(jī)”。
也標(biāo)志著在通往空間計算這條路上,VST陣營下的蘋果、OST陣營下的Rokid,現(xiàn)在都已交出最新答卷。
此外這次發(fā)布也重磅介紹了Rokid和Google的合作:Station(國際版)成為全球首款經(jīng)谷歌認(rèn)證的AR版便攜式Android TV?設(shè)備。
通過Rokid Station(全球版),用戶可以在Google Play上下載熟悉的應(yīng)用和游戲,包括 YouTube、Hulu、Disney+、TVer、AbemaTV等,還有海量沉浸式游戲,輕松上手。用戶還可以自己安裝APP;此外,它還支持HDCP和云游戲。
這也傳遞出了一個事實(shí)——如今行業(yè)正在加碼對于AR軟件和生態(tài)的建設(shè),AR行業(yè)進(jìn)入了軟件系統(tǒng)和生態(tài)建設(shè)的第二階段。
不過AR硬件作為ToC產(chǎn)品,大眾如何理解它非常關(guān)鍵。這幾年雖然AR新品層出不窮,但是由于最常見的場景還是觀影、游戲等,它暫時還沒有被正式歸入生產(chǎn)力工具行列。
而在此時此刻直接打出“空間計算機(jī)”的概念,更是對大眾認(rèn)知構(gòu)成挑戰(zhàn)。
為什么會這么做?
在這背后,有趨勢的直接推動,也有行業(yè)本身的發(fā)展節(jié)奏使然,更有Rokid作為行業(yè)引領(lǐng)者長期以來的思考理解。
空間計算機(jī),為什么是現(xiàn)在?
直接原因來自最新趨勢。
今年蘋果發(fā)布Vision Pro,把一個行業(yè)內(nèi)的專業(yè)詞匯帶到了大眾面前:
空間計算。
自此,關(guān)于AR/MR的想象有了一個更具體的表述,也將AR/MR的終極目標(biāo)直接刻畫出來。
即,將計算能力與物理空間相結(jié)合,通過頭顯設(shè)備將數(shù)字信息融合到真實(shí)世界中,以提供一種更直觀、更沉浸式的交互方式,讓用戶能在現(xiàn)實(shí)世界中與數(shù)字內(nèi)容進(jìn)行互動。
Rokid創(chuàng)始人兼CEO 祝銘明(Misa)非常坦誠地說,蘋果做過一輪市場教育以后,對于行業(yè)來說是一個時機(jī)。
蘋果將這一概念拋出去后,我們也可以直接用它來和市場用戶溝通。AR本身默認(rèn)定位就是空間技術(shù)、虛實(shí)融合,只是今天把背后的技術(shù)變成了一個產(chǎn)品描述方式。
坦白講,這件事也只有蘋果能做到。
由此也引出深層原因,行業(yè)本身到了擁抱空間計算的階段。
技術(shù)方面,無論是空間、交互還是處理計算層面,目前都發(fā)展到了更加成熟的階段。
比如空間方面,6DoF實(shí)現(xiàn)了對頭部視野角度變化、身體移動位移變化的精準(zhǔn)檢測;SLAM則能類比自動駕駛中道路精度地圖和車輛空間感知。
交互方面,頭動、眼動追蹤已是目前頂尖XR設(shè)備的標(biāo)配,眼動追蹤的精確度可以達(dá)到1度。以及微手勢交互的應(yīng)用也相對成熟。
而在計算處理方面,如高通已推出第一代驍龍XR2+,提升續(xù)航和散熱能力,支持在更小更輕薄設(shè)備中搭載。支持并行感知技術(shù),包括頭部、手勢和手柄追蹤、3D 重建以及低時延視頻透視。引入全新圖像處理管線,能夠?qū)崿F(xiàn)低于 10 毫秒的時延,能提供更好的透視MR體驗。
另外,在軟件系統(tǒng)和生態(tài)建設(shè)方面,AR也已進(jìn)入第二階段,也就是更加原生獨(dú)立的階段。
所謂第一階段,是指軟件系統(tǒng)和生態(tài)更加依賴手機(jī)、電腦等傳統(tǒng)移動終端。
這一階段是必然的,因為搭建原生豐富AR的系統(tǒng)和生態(tài)無法一蹴而就。
自研操作系統(tǒng)難度系數(shù)很大,需要具備全棧式能力。加之AR設(shè)備本身就面臨功耗、續(xù)航、計算性能幾方面難平衡的尷尬,給操作系統(tǒng)提出了更高要求。
生態(tài)方面的建設(shè)則還需要聚集行業(yè)及開發(fā)者的力量,這更是一個需要積累、摸索的過程。
目前來看,第一階段已經(jīng)基本進(jìn)行完畢。
以Rokid為例,其自研底層操作系統(tǒng)YodaOS-Master,沉淀已有5-6年,并在今年完成最新升級。正是在這一系統(tǒng)的支持下,Station Pro可以實(shí)現(xiàn)單攝SLAM、微手勢交互、視覺定位VPS等,Rokid Max Pro則可以在計算能力大幅提升的前提下,機(jī)身重量僅增加1g。
生態(tài)建設(shè)方面,Rokid在今年Open Day上發(fā)布的AR創(chuàng)作工具靈境,實(shí)現(xiàn)了10分鐘內(nèi)建造屬于自己的AR數(shù)字空間,這是為了吸引更多開發(fā)者、創(chuàng)作者來壯大AR內(nèi)容生態(tài)。
目前Rokid UXR 2.0 開放SDK,并支持Unity等OpenXR標(biāo)準(zhǔn)的主流引擎,以及MRTK接口,開發(fā)者可以輕松開發(fā)移植。
同時,在Master系統(tǒng)里,Rokid還內(nèi)置了自研JSAR引擎和小組件容器,JS開發(fā)者可以輕松上傳自己的組件。由此可以更進(jìn)一步推動行業(yè)生態(tài)共創(chuàng)。
另外在全行業(yè)范圍內(nèi),大家也對技術(shù)變革興趣濃厚,尤其是科技大廠,在擁抱新技術(shù)上的意愿很強(qiáng)烈。比如目前Rokid和阿里巴巴、華為、微軟Bing都有深度合作。
所以,對于AR來說是時候大力建設(shè)更加獨(dú)立和原生的系統(tǒng)和生態(tài)了。
如何體現(xiàn)這種原生?錨定空間計算。Rokid在系統(tǒng)生態(tài)上的建設(shè)就是實(shí)踐案例。
最后在市場方面,AR眼鏡已經(jīng)成為大眾普遍接受的一種形態(tài),是時候把AR真正帶到人們生活中去了。
AR市場的發(fā)展最開始興起在ToB,行業(yè)愿意花一定資金擁抱新技術(shù)進(jìn)行升級,AR行業(yè)由此有機(jī)會得到真實(shí)的市場反饋、不斷進(jìn)行技術(shù)迭代。
后面AR開始在觀影、游戲等方面打開場景,逐步讓消費(fèi)者接受一個架在眼前的終端設(shè)備。
如今這種習(xí)慣已經(jīng)建立,需要將真正的AR引入到用戶生活中了。
怎樣向用戶傳遞什么是“真正的AR”?空間計算是最好的體現(xiàn)方式之一。
綜上多方面原因,也就不難理解為什么行業(yè)玩家Rokid會在此刻連發(fā)兩款新品,并組成一臺“空間計算機(jī)”。
而且對于空間計算機(jī)的定義,Rokid也給出了初步思考,關(guān)鍵在于滿足這樣幾個核心指標(biāo)。
第一,搭建起和真實(shí)世界、用戶的自然交互;
第二,展現(xiàn)和處理能力,能夠撐起“計算機(jī)”的稱號;
第三,良好的軟件兼容性、生態(tài)豐富性。
而隨著Rokid“空間計算機(jī)”的提出,頭顯兩大發(fā)展路線VST和OST,如今都已用實(shí)際產(chǎn)品交出最新答卷。
一邊是蘋果Vision Pro為代表的的VST,另一邊是Rokid Max Pro為代表的的OST。
二者在表現(xiàn)形態(tài)上不盡相同,但都主打空間計算。
這意味著對于下一階段的目標(biāo),行業(yè)已經(jīng)達(dá)成共識;但是在具體實(shí)現(xiàn)路徑上,尚不能形成定論。
而在這兩種不同的技術(shù)路線之下,共同構(gòu)成了對于下一代人機(jī)交互的最新理解。
人機(jī)交互下一頁,OST還是VST?
先來看這兩條路徑分別是什么。
VST(視頻透視),以蘋果Vision Pro等為代表。
它利用攝像頭等傳感器,捕捉真實(shí)世界的影像,然后投射到屏幕上,看到的內(nèi)容都是虛擬重建的。
優(yōu)點(diǎn)是可以構(gòu)建一個更加虛擬的世界,效果更加夢幻。
但是這也意味著對硬件、光線要求更高。
如Vision Pro采用多攝像頭、雙芯片方案,也進(jìn)一步拉高了頭顯重量和成本價格。
OST(光學(xué)透視),代表產(chǎn)品有Hololens、Rokid Max Pro等。
它可以通過一層玻璃,讓人看到的永遠(yuǎn)是真實(shí)世界,在此基礎(chǔ)上構(gòu)建虛擬物品,可以和現(xiàn)實(shí)世界產(chǎn)生交互。
它的優(yōu)點(diǎn)是能讓人感受真實(shí)的世界,眼鏡形式更加輕便。
但在目前底層硬件技術(shù)的制約下,也勢必需要犧牲性能、續(xù)航和散熱。而且還需要不斷在性能和重量之間做取舍。
目前來看,這兩條路線并駕齊驅(qū),都用自己的方式詮釋了對空間計算的理解。
從更底層來看,二者對于新一代人機(jī)交互方式的理解,有相同之處,也有區(qū)別點(diǎn)。
先來看相同點(diǎn)。
二者在初步認(rèn)知上達(dá)成一致,都認(rèn)為要將數(shù)字內(nèi)容融入到真實(shí)空間里。那么就意味著要和真實(shí)世界產(chǎn)生交互。
在交互方式上,它們也紛紛選擇采用更加接近人類本能的手勢操作、眼動、頭動,由此和傳統(tǒng)二維的人機(jī)交互方式徹底分隔開來。
以及在操作系統(tǒng)和內(nèi)容方面,無論是蘋果還是Rokid都一定程度上向2D內(nèi)容生態(tài)兼容,這是為了能讓用戶更加自然過渡到頭顯設(shè)備場景下。
比如Vision Pro的系統(tǒng)仿佛是iOS、MacOS、iPadOS直接升維后的效果,為了能讓用戶更快習(xí)慣。
Rokid AR Studio也兼容2D生態(tài),如愛奇藝、騰訊視頻、嗶哩嗶哩、優(yōu)酷、芒果TV、影牛牛、隨樂游、無影云電腦等都能在Rokid Station Pro進(jìn)行使用。其中,無影云電腦為適配3D生態(tài)特別定制了空間大屏。其他手機(jī)、PAD等移動終端的眾多2D安卓應(yīng)用也可在其中使用。
但相對而言,VST和OST路線之間還是存在諸多差異,從這些差異背后也能窺見二者對于人機(jī)交互大命題的不同理解。
其一,在佩戴舒適性和效果呈現(xiàn)的優(yōu)先級方面,二者選擇不同。
蘋果顯然是將效果呈現(xiàn)更為前置,為此不惜Vision Pro中放入2塊芯片、12個攝像頭、5個傳感器,整個頭顯重量達(dá)到450克,成為限制用戶使用時長的一個重要因素。
Rokid始終堅持佩戴舒適優(yōu)先,Rokid Max Pro的重量僅有76g,可以輕松架在鼻梁上。但這勢必會使得眼鏡端上算力受限,所以Rokid推出了AR主機(jī)的概念,希望以一種中間形態(tài),來緩解目前OST路線面臨的困境。
而輕便有限的好處是能拉長用戶的使用時長,同時不連接手機(jī)使用,可以更好和手機(jī)等傳統(tǒng)移動終端搶時長,推動AR更進(jìn)一步走向獨(dú)立。
據(jù)Rokid數(shù)據(jù)顯示,在用戶使用Station后,有90%用戶都放棄了連接手機(jī)的方案。
其二,在生態(tài)構(gòu)建方面,二者走向兩條不同的道路。
一直以來蘋果都是構(gòu)建自己的獨(dú)立生態(tài),它能通過自身強(qiáng)大的軟硬件能力,不斷加強(qiáng)用戶對于產(chǎn)品與產(chǎn)品之間的交互使用體驗,并召集大量開發(fā)者豐富軟件生態(tài)。這也是蘋果幾乎最獨(dú)特的魅力。
但這也意味著,蘋果拿出的技術(shù)方案、產(chǎn)品規(guī)格,對行業(yè)內(nèi)大部分玩家意義不大。
另一邊,以Rokid為代表的OST路線玩家,致力于構(gòu)建更加開放的生態(tài),聯(lián)合更多行業(yè)力量來共建新標(biāo)準(zhǔn)、新規(guī)范。
比如微軟HoloLens沉淀下來的MRTK工具包,在幾天前正式宣布將獨(dú)立發(fā)展,由此它將成為一個真正的跨平臺開源工具包。通過MRTK構(gòu)建的體驗,可以兼容任何支持OpenXR的設(shè)備。
以及這一次Rokid最新提出的對于空間計算的思考,也會更新到OpenXR標(biāo)準(zhǔn)中去,供行業(yè)參考。這樣一來,對于行業(yè)標(biāo)準(zhǔn)的定義更新,將由整個行業(yè)推動,發(fā)展速度將會十分可觀。
與此同時,安卓AR開放生態(tài)也開始發(fā)力。目前通過Rokid Station(全球版),可以在Google Play上下載熟悉的應(yīng)用和游戲,以及體驗Android TV。
無論是共識還是差異,對于當(dāng)下尚處在發(fā)展早期的AR/MR行業(yè)而言,都意義深遠(yuǎn)。
蘋果和Rokid,作為VST和OST路線的領(lǐng)軍代表,率先給出對空間計算的理解,也使它們成為了當(dāng)下行業(yè)真正意義上的引領(lǐng)者。
未來,二者會繼續(xù)保持并駕齊驅(qū),還是會走向截然相反的道路,目前還無法給出判斷。
但可以確定的是,對AR的終極構(gòu)想,一定以新一代人機(jī)交互為底座。
而它的根本邏輯是什么?
更沉浸虛擬還是更融合現(xiàn)實(shí)?更連續(xù)還是更碎片化?對于廣大用戶來說,如何適應(yīng)從實(shí)體交互走向虛擬?如何將自身與虛實(shí)相生的世界融合?
這些都是AR行業(yè)將會面臨的挑戰(zhàn)。
總之,空間計算概念走向大眾,才只是真實(shí)AR世界撕開的第一道裂縫。
接下來的該如何“盲人摸象”,拼湊出終極AR的所有版圖,還有很長的路要走。
話說回來,你對實(shí)現(xiàn)了空間計算的AR設(shè)備有哪些期待?會因為空間計算的實(shí)現(xiàn)而想要購入設(shè)備嗎?希望它能在哪些場景發(fā)揮作用?
歡迎評論區(qū)留言分享~