隨著 5G 和 AI 的快速迭代,機(jī)器視覺也進(jìn)入了高速發(fā)展的新階段。
機(jī)器視覺是指利用相機(jī)、攝像機(jī)等傳感器,配合機(jī)器視覺算法賦予智能設(shè)備人眼的功能,從而進(jìn)行物體的識(shí)別、檢測(cè)、測(cè)量等功能。簡單說來,機(jī)器視覺就是用機(jī)器代替人眼來做測(cè)量和判斷。
機(jī)器視覺是在 20 世紀(jì) 50 年代從統(tǒng)計(jì)模式識(shí)別開始的,當(dāng)時(shí)的工作主要集中在二維圖像分析和識(shí)別。如今,隨著 5G、AI 等技術(shù)的日益發(fā)展,為機(jī)器視覺的升級(jí)帶來可能,將加速信息顯示從二維向三維過渡。
三維機(jī)器視覺是在二維機(jī)器視覺的基礎(chǔ)上增加了物理空間的深度信息,更全面、更真實(shí)地記錄了物理世界。因此,業(yè)內(nèi)一致認(rèn)為三維機(jī)器視覺技術(shù)是機(jī)器視覺領(lǐng)域新的技術(shù)突破,也是機(jī)器視覺領(lǐng)域新的商業(yè)風(fēng)口。
目前,機(jī)器視覺是正在快速發(fā)展的一個(gè)領(lǐng)域,正處于不斷突破、走向成熟的階段。它的發(fā)展不僅將大大推動(dòng)智能系統(tǒng)的發(fā)展,提高生產(chǎn)效率和自動(dòng)化程度,也將拓寬計(jì)算機(jī)與各種智能機(jī)器的研究范圍和應(yīng)用領(lǐng)域。
3D 視覺如何取代 2D?
縱觀行業(yè)發(fā)展,2D 視覺雖為當(dāng)前主流,但隨著測(cè)量精度要求越來越高,被測(cè)物體條件越來越復(fù)雜,2D 系統(tǒng)的缺陷也愈發(fā)突出。目前市場(chǎng)上可見的 2D 識(shí)別,實(shí)質(zhì)上屬于軟件層面驗(yàn)證技術(shù),雖然能夠做檢測(cè),但是存在可靠性不高、局限性、安全性差等諸多缺陷。
相比之下,3D 視覺技術(shù)在精度、靈活性和速度方面都是 2D 無可比擬的。的盧深視創(chuàng)始人兼 CEO 戶磊向筆者說道,3D 機(jī)器視覺能夠精準(zhǔn)識(shí)別視野內(nèi)空間每個(gè)點(diǎn)位的三維坐標(biāo)信息,通過算法復(fù)原智能獲取三維立體成像。不但可以提高測(cè)量和識(shí)別的效率,從三個(gè)維度獲取信息,更增加了信息的準(zhǔn)確性和可靠性。
從技術(shù)角度來看,普通的 2D 成像是用平面?zhèn)鞲衅鹘邮毡慌臄z物體反射或者發(fā)出的可見光,從而形成二維圖像。由于現(xiàn)實(shí)世界是三維世界,2D 成像存在物體特征信息損失的情況,這意味著 2D 成像并不支持與物體三維信息的測(cè)量。例如 3D 人臉識(shí)別、三維建模、人機(jī)交互、AR、智能安防等功能。
為了彌補(bǔ) 2D 人臉識(shí)別的不足,3D 人臉識(shí)別應(yīng)運(yùn)而生。3D 傳感技術(shù)實(shí)現(xiàn)了物體實(shí)時(shí)三維信息的采集,為后期的圖像分析提供了關(guān)鍵特征,智能設(shè)備能夠根據(jù) 3D 傳感復(fù)原現(xiàn)實(shí)三維世界,并實(shí)現(xiàn)后續(xù)的智能交互。
根據(jù) Yole 的數(shù)據(jù),2017-2023 年全球 3D 成像和傳感器市場(chǎng)規(guī)模的復(fù)合年均增長率為 44%,預(yù)計(jì) 2023 年,3D 傳感市場(chǎng)規(guī)模將達(dá)到 184 億美元。
不難判斷,在此趨勢(shì)下,3D 機(jī)器視覺將面臨較快的增長趨勢(shì),3D 視覺未來將逐步取代 2D 識(shí)別技術(shù),在許多“痛點(diǎn)型應(yīng)用場(chǎng)景”中大顯身手,發(fā)展成為主流視覺系統(tǒng)。
安全問題凸顯
眾所周知,隨著人臉識(shí)別技術(shù)的深入,千萬級(jí)人臉大庫的重要性日益顯現(xiàn)。采集建庫既是三維人臉識(shí)別應(yīng)用的基礎(chǔ),也是三維人臉識(shí)別技術(shù)落地的關(guān)鍵。
近日《2019 年中國刷臉支付技術(shù)應(yīng)用社會(huì)價(jià)值專題研究報(bào)告》顯示,2019 年成為刷臉支付的“新元年”,刷臉支付用戶將達(dá)到 1.18 億人,到 2022 年有望突破 7 億人,或取代掃碼成為主流支付方式?,F(xiàn)在人臉識(shí)別方式越來越為大眾所使用,但關(guān)于個(gè)人信息安全等問題也隨之而來。
對(duì)此,戶磊表示,“人臉識(shí)別領(lǐng)域沒有絕對(duì)的安全,安全是與成本息息相關(guān)的。從商業(yè)層面考慮,安全更多是取決于安全成本與作偽成本之間的考量。”
安全性上,的盧深視也有布局。一方面其算法已通過 BCTC 增強(qiáng)級(jí)認(rèn)證,滿足國家認(rèn)證金融支付增強(qiáng)級(jí)安全標(biāo)準(zhǔn),可實(shí)現(xiàn)高強(qiáng)度防作偽。
另一方面,的盧深視對(duì)于小群體應(yīng)用場(chǎng)景產(chǎn)品做了針對(duì)性的設(shè)計(jì),以其 3D-Face ID 一體化解決方案智能門鎖為例,內(nèi)嵌一顆 AIoT 專用芯片,人臉信息存儲(chǔ)以及人臉比對(duì)均在門鎖端完成。借助在金融支付行業(yè)內(nèi)的豐富終端安全經(jīng)驗(yàn),打造了一個(gè)安全、受信的安全比對(duì)環(huán)境,外界是無法通過任何物理手段或者其他暴力拆解手段來獲取模組內(nèi)的私密個(gè)人生物特征信息。
基于成熟落地經(jīng)驗(yàn),的盧深視把三維機(jī)器視覺技術(shù)從高端安防領(lǐng)域切入金融支付、智慧社區(qū)、消費(fèi)電子、商超零售、虛擬現(xiàn)實(shí)等垂直細(xì)分領(lǐng)域,要用成熟的三維全棧技術(shù)賦能百業(yè)千家。
目前市場(chǎng)上主流的 3D 識(shí)別技術(shù)
近日,在 2020 全球人工智能產(chǎn)品應(yīng)用博覽會(huì)(AIExpo2020)的現(xiàn)場(chǎng),的盧深視向與非網(wǎng)全面展示了其三維視覺全棧技術(shù)解決方案。
戶磊介紹道,的盧深視深耕三維機(jī)器視覺領(lǐng)域近 5 年,是國內(nèi)唯一打通“真三維”全棧技術(shù)、并實(shí)現(xiàn)國家級(jí)項(xiàng)目落地應(yīng)用的公司。公司基于“云+端+芯”一體化戰(zhàn)略,布局產(chǎn)品矩陣,下鉆垂直行業(yè)應(yīng)用領(lǐng)域,實(shí)現(xiàn)垂直整合及系統(tǒng)優(yōu)化。公司可提供大規(guī)模普及的、交互距離內(nèi)高精度的三維視覺感知產(chǎn)品及方案,產(chǎn)品形態(tài)涵蓋 Edge AI 芯片、智能模組、通用產(chǎn)品和行業(yè)解決方案。
談到三維識(shí)別技術(shù)方案,目前市場(chǎng)上主流的有結(jié)構(gòu)光、ToF、雙目視覺等三種 3D 視覺技術(shù)。
- 3D 結(jié)構(gòu)光通過紅外光投射器,將具有一定結(jié)構(gòu)特征的光線投射到被拍攝物體上,再由專門的紅外攝像頭進(jìn)行采集。主要利用三角形相似的原理進(jìn)行計(jì)算,從而得出圖像上每個(gè)點(diǎn)的深度信息,最終得到三維數(shù)據(jù)。
- ToF 是利用激光測(cè)距,照射光源一般采用方波脈沖調(diào)制,根據(jù)脈沖發(fā)射和接收的時(shí)間差來測(cè)算距離。
- 雙目立體視覺則是基于視差原理并由多幅圖像獲取物體三維幾何信息的方法。由雙攝像機(jī)從不同角度同時(shí)獲得被測(cè)物的兩幅數(shù)字圖像,并基于視差原理恢復(fù)出物體的三維幾何信息,從而得出圖像上每個(gè)點(diǎn)的深度信息、最終得到三維數(shù)據(jù)。
可以看到,三種 3D 視覺測(cè)量原理都有各自的優(yōu)缺點(diǎn)。
與非網(wǎng)制圖
?
就目前看來,3D 結(jié)構(gòu)光是各大廠商普遍采用的技術(shù)。同樣以的盧深視為例,的盧深視推出了兩款基于 3D 結(jié)構(gòu)光技術(shù),針對(duì)安全需求高小型人臉庫場(chǎng)景推出的自研國產(chǎn) 3D CV 相機(jī):高精度 RGBD 相機(jī)(標(biāo)準(zhǔn)型)和 3D-Face ID 智能模組。
戶磊進(jìn)一步指出,公司自研的 3D CV 相機(jī)均已實(shí)現(xiàn)量產(chǎn),在 3 米范圍誤差小于 1mm,指標(biāo)超越國際 3D 相機(jī)巨頭,且量產(chǎn)良率超 99%,精度全球領(lǐng)先,具備獨(dú)家專利技術(shù),高度自主可控。
的盧深視 3D-Face ID 智能模組
?
其中,高精度 RGBD 相機(jī)可用于刷臉支付終端、銀行 ATM、無人貨柜、地鐵刷臉閘機(jī)、AR/VR、物品體積測(cè)量等場(chǎng)景;3D-Face ID 智能模組可用于家庭智能門鎖、智能保險(xiǎn)柜、酒店公寓智能鎖、智能門禁等場(chǎng)景。
此外,對(duì)于可靠性和精度要求較高的制造業(yè)等領(lǐng)域來看,戶磊表示,將幾種測(cè)量原理結(jié)合一起的 3D 視覺技術(shù)也是未來發(fā)展的一個(gè)方向。
趨勢(shì)之外,痛點(diǎn)仍在
- 產(chǎn)業(yè)鏈匹配不完善
相對(duì) 2D 成像而言,3D 傳感技術(shù)的優(yōu)勢(shì)還體現(xiàn)在可產(chǎn)生大量的三維數(shù)據(jù),這些數(shù)據(jù)未來可應(yīng)用于大數(shù)據(jù)等行業(yè),具有巨大的行業(yè)應(yīng)用價(jià)值。
但是數(shù)據(jù)本身的豐富度反過來也會(huì)影響數(shù)據(jù)質(zhì)量和精度,這也對(duì)傳感器和相機(jī)提出了較高要求。現(xiàn)階段 3D 視覺行業(yè)的核心難點(diǎn)集中在產(chǎn)業(yè)鏈匹配不完善。
據(jù)了解,現(xiàn)階段 3D 視覺行業(yè)的核心難點(diǎn)集中在產(chǎn)業(yè)鏈匹配不完善。和很多新興行業(yè)一樣,在 3D 視覺行業(yè)蓬勃發(fā)展的同時(shí),產(chǎn)業(yè)鏈條體系混亂、產(chǎn)業(yè)關(guān)鍵鏈路無法閉環(huán)等問題逐步凸顯,這些問題成為制約行業(yè)發(fā)展的瓶頸。
三維視覺產(chǎn)業(yè)鏈涵蓋核心器件、模組裝配、像機(jī)成像系統(tǒng)設(shè)計(jì)、算法、感知技術(shù)方案與模塊、終端產(chǎn)品與行業(yè)方案多個(gè)環(huán)節(jié),由于三維機(jī)器視覺仍屬于較前沿的技術(shù),供應(yīng)鏈匹配上存在技術(shù)難度高、標(biāo)準(zhǔn)不統(tǒng)一等諸多問題,整合產(chǎn)業(yè)鏈?zhǔn)?3D 視覺產(chǎn)業(yè)化應(yīng)用的必要路徑。
在產(chǎn)業(yè)鏈環(huán)節(jié),的盧深視定位為三維視覺感知系統(tǒng)技術(shù)方案提供商,上游承接相機(jī)模組裝配,通過團(tuán)隊(duì)研發(fā)的相機(jī)的系統(tǒng)設(shè)計(jì)和內(nèi)部算法形成 3D 感知技術(shù)模組、3D 通用產(chǎn)品、Edge AI 芯片以及行業(yè)解決方案,對(duì)于安防行業(yè)主要提供通用的終端產(chǎn)品,對(duì)于其它行業(yè)提供相關(guān)智能模組,并由下游的集成商合作伙伴將最終產(chǎn)品供給消費(fèi)者。
從行業(yè)整體來看,在現(xiàn)階段,如何借著轟轟烈烈的 AI 和 5G 浪潮,為行業(yè)搭建起一個(gè)凝聚上下游資源、協(xié)同產(chǎn)業(yè)鏈創(chuàng)新發(fā)展的平臺(tái)成為迫在眉睫的事情。
- 硬件價(jià)格和系統(tǒng)成本
傳統(tǒng)的機(jī)器視覺穩(wěn)定發(fā)展多年,目前處于硬件和軟件的發(fā)展基本匹配的階段。但是隨著檢測(cè)需求以及對(duì)安全性及可靠性等要求的提高,未來將用到深度學(xué)習(xí)來完成功能賦能,現(xiàn)在基礎(chǔ)的硬件需要做到領(lǐng)先于軟件一代。
因此,成本高又成為了當(dāng)前產(chǎn)業(yè)痛點(diǎn)之一。有行業(yè)資深人士表示,從硬件價(jià)格和系統(tǒng)成本來看,要突破傳統(tǒng)上所謂二年投入回報(bào)周期這一困局。兩年回收成本已經(jīng)無法撬動(dòng)行業(yè)需求,一年左右的時(shí)間周期才會(huì)帶動(dòng)中小企業(yè)愿意買單。
技術(shù)價(jià)值最大化的關(guān)鍵在于逐漸形成大規(guī)模的普及應(yīng)用,通過大面積提升行業(yè)的生產(chǎn)力水平和經(jīng)濟(jì)效益獲得,通過給客戶帶來價(jià)值而盈利,這是一個(gè)較為艱難的過程,但也是一個(gè)需要慢慢推進(jìn)的必要過程。
從機(jī)器視覺發(fā)展的客觀現(xiàn)狀來講,其實(shí)并不缺市場(chǎng)需求,但是缺少能夠真正落地的、真正發(fā)揮出經(jīng)濟(jì)效益的好產(chǎn)品。那么,應(yīng)該如何打破這個(gè)“緊箍咒”?推動(dòng)更多的落地應(yīng)用?
解決核心零部件的性價(jià)比,做到系統(tǒng)成熟穩(wěn)定可靠,是迫在眉睫的事情。只要將性價(jià)比做到極致,就能滿足目前工業(yè)機(jī)器視覺中絕大多數(shù)的應(yīng)用需求。另一方面,也體現(xiàn)在產(chǎn)品的適用性、標(biāo)準(zhǔn)化程度上。需要對(duì)視覺應(yīng)用真正的剛性需求逐漸顯現(xiàn)出來,進(jìn)而實(shí)現(xiàn)降本增效的效果。
寫在最后
在國內(nèi)如火如荼的科技發(fā)展浪潮和國內(nèi)經(jīng)濟(jì)發(fā)展的時(shí)代大背景下,3D 視覺產(chǎn)業(yè)鏈的優(yōu)化和鏈路閉環(huán)正在加劇進(jìn)行,產(chǎn)業(yè)形態(tài)的完備也將釋放出巨大的集群紅利,為產(chǎn)業(yè)鏈各環(huán)節(jié)創(chuàng)造新的發(fā)展局面。
在用戶日常觸達(dá)較高的刷臉支付方面,中國企業(yè)表現(xiàn)不俗,產(chǎn)業(yè)圍繞 3D 視覺技術(shù)研究及應(yīng)用開展合作,共同推進(jìn)金融領(lǐng)域科技創(chuàng)新,成為中國金融支付領(lǐng)域?qū)崿F(xiàn)彎道超車的關(guān)鍵。
從智能支付到智能門鎖,包括的盧深視在內(nèi)的行業(yè)企業(yè)在探索 3D 機(jī)器視覺應(yīng)用的更多新方向。的盧深視配合式三維人臉采集終端填補(bǔ)了國內(nèi)三維人臉數(shù)據(jù)采集設(shè)備的技術(shù)空白,為千萬級(jí)大庫時(shí)代人臉識(shí)別技術(shù)及場(chǎng)景奠定了基礎(chǔ),標(biāo)志著的盧深視三維全棧閉環(huán)已然成熟,打通了從云端建庫、算法比對(duì)、模組方案到終端產(chǎn)品的全鏈條,真正實(shí)現(xiàn)了技術(shù)應(yīng)用的“最后一公里”。
如今,中國已突破 3D 人臉識(shí)別技術(shù)的壁壘,相信在不久的將來,中國 3D 傳感技術(shù)定會(huì)再上一個(gè)臺(tái)階,為更多用戶及其行業(yè)帶來更安全、方便、快捷的智慧生活體驗(yàn)。