機(jī)器視覺作為驅(qū)動中國制造業(yè)發(fā)展的重要先進(jìn)技術(shù),在半導(dǎo)體、電子制造、汽車、醫(yī)藥和食品包裝等領(lǐng)域得到廣泛應(yīng)用;在此背景下,高工產(chǎn)業(yè)研究所(GGII)預(yù)測2024年中國機(jī)器視覺市場規(guī)模有望突破200億元,同比增速接近12%。
隨著人工智能(AI)技術(shù)的迅猛發(fā)展,多數(shù)制造行業(yè)的機(jī)器視覺負(fù)責(zé)人認(rèn)為AI機(jī)器視覺可以實(shí)現(xiàn)更好的性能和更多的功能。因此,為行業(yè)提供機(jī)器視覺解決方案的合作伙伴們需要進(jìn)一步思考如何為客戶優(yōu)化前沿技術(shù),讓深度學(xué)習(xí)機(jī)器視覺等技術(shù)在企業(yè)內(nèi)部變得更易于獲取、更便于使用、并部署得更好。此外,云計(jì)算的部署也是推動機(jī)器視覺應(yīng)用的重要一環(huán),盡管仍有一些制造商對于云計(jì)算的采用躊躇不前,現(xiàn)在正是克服這些顧慮的最佳時(shí)機(jī)。
對于制造商而言,購入機(jī)器視覺解決方案的方式多種多樣,主要方式之一是在生產(chǎn)地點(diǎn)進(jìn)行現(xiàn)場方案評估和選擇,后續(xù)進(jìn)入公司的審批流程;或者方案的選擇和審批等主要流程均在生產(chǎn)地點(diǎn)現(xiàn)場進(jìn)行。這種以“現(xiàn)場”為中心的方式有其優(yōu)點(diǎn),但也可能帶來一些不盡如人意的部署差異。具體而言,即便是相似的工作流程,不同生產(chǎn)地點(diǎn)也可能采用不同的機(jī)器視覺解決方案,而且這些地點(diǎn)之間可能無法實(shí)現(xiàn)專業(yè)知識和數(shù)據(jù)的共享。即便團(tuán)隊(duì)有相關(guān)需求,也很難通過傳統(tǒng)的機(jī)器視覺系統(tǒng)實(shí)現(xiàn)集成、互通和安全的數(shù)據(jù)共享。
不同的生產(chǎn)地點(diǎn)帶來的數(shù)據(jù)挑戰(zhàn)
AI,尤其是深度學(xué)習(xí),它們因數(shù)據(jù)而生,大量、多樣的優(yōu)質(zhì)數(shù)據(jù)和快速的數(shù)據(jù)生成、處理速度是訓(xùn)練和測試深度學(xué)習(xí)模型的關(guān)鍵,這樣我們才可以在實(shí)際部署時(shí)實(shí)現(xiàn)預(yù)期的效果。
不同團(tuán)隊(duì)和生產(chǎn)地點(diǎn)之間的經(jīng)驗(yàn)和可用時(shí)間各不相同,信息孤島由此顯現(xiàn),這加大了獲得優(yōu)質(zhì)數(shù)據(jù)的難度。數(shù)據(jù)需要在存儲、標(biāo)注后用于訓(xùn)練模型,而模型測試還需要使用其他數(shù)據(jù)集。在這種情況下,處于“孤島”狀態(tài)的企業(yè)數(shù)據(jù)是沒有意義的,不利于更好地訓(xùn)練機(jī)器視覺模型。
深度學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)應(yīng)盡可能多地接觸到各種變量,包括不同的生產(chǎn)時(shí)間和生產(chǎn)天數(shù)。除非使用能夠模擬訓(xùn)練數(shù)據(jù)的平臺,數(shù)據(jù)集必須混合不同時(shí)間點(diǎn)的隨機(jī)數(shù)據(jù),盡管這需要采集一段時(shí)間內(nèi)的數(shù)據(jù),并且可能會帶來不便,但這正是訓(xùn)練一個強(qiáng)大模型的關(guān)鍵所在。如何才能充分利用各個生產(chǎn)地點(diǎn),甚至是跨國家和地區(qū)的所有可用數(shù)據(jù),這是制造商及其機(jī)器視覺負(fù)責(zé)人面臨的主要挑戰(zhàn)之一。
不同的生產(chǎn)地點(diǎn)帶來的另一難題在于如何確保深度學(xué)習(xí)模型基于多樣化的對象集進(jìn)行訓(xùn)練。在一組數(shù)量有限且?guī)缀跸嗤膶ο蠹嫌?xùn)練而成的模型,難以應(yīng)對現(xiàn)實(shí)世界的變化和差異。例如,訓(xùn)練一個模型用以識別制造組件的缺陷,不能僅依靠20張同一組件的不同角度圖像。訓(xùn)練數(shù)據(jù)中需要有20至50個真正不同的對象才能確保模型的有效性,盡管整個生產(chǎn)場景可能受到地點(diǎn)變化的影響(例如不同的照明和/或不同的傳送帶等),但這些對象必須有明顯的區(qū)別,除背景之外沒有任何其他相同元素。
工業(yè)流程還受到各種環(huán)境因素的影響,例如不斷變化的環(huán)境光、材料的細(xì)微差別、振動、噪聲、溫度、生產(chǎn)條件的改變等。如果訓(xùn)練數(shù)據(jù)未考慮到這些變化,就會降低模型的準(zhǔn)確性。每個地點(diǎn)都可能在清晰度、工作距離、環(huán)境光等因素上有所不同,模型也會學(xué)習(xí)和處理這些變量,因此訓(xùn)練數(shù)據(jù)集應(yīng)反映模型在現(xiàn)實(shí)場景中可能遇到的各種變化。如果工業(yè)流程涉及到多個生產(chǎn)地點(diǎn),顯然不能只采集其中一個地點(diǎn)的數(shù)據(jù),或者將所有生產(chǎn)地點(diǎn)的數(shù)據(jù)孤立保存。因此,實(shí)現(xiàn)不同環(huán)境條件、不同生產(chǎn)地點(diǎn)的數(shù)據(jù)采集和共享也必不可少。
不同的生產(chǎn)地點(diǎn)所帶來的另一個問題是深度學(xué)習(xí)模型訓(xùn)練數(shù)據(jù)的標(biāo)注。數(shù)據(jù)標(biāo)注不準(zhǔn)確、不清晰和不一致必然會導(dǎo)致模型表現(xiàn)不佳,可見確保標(biāo)注精確且無歧義至關(guān)重要,這需要制造業(yè)團(tuán)隊(duì)在標(biāo)注項(xiàng)目上開展協(xié)作。在實(shí)際操作中,一個常見錯誤是在不同的圖像上標(biāo)注不同的缺陷類型,而有些缺陷卻又完全沒有標(biāo)注,而且對于什么是缺陷的判斷也可能是主觀的,因此交叉驗(yàn)證非常關(guān)鍵。無論哪種類型的缺陷都應(yīng)清晰地標(biāo)注在所有相關(guān)圖像上。同樣,如果不采取統(tǒng)一的標(biāo)注方法也不利用云技術(shù)的話,跨地點(diǎn)或跨國家的數(shù)據(jù)標(biāo)注挑戰(zhàn)也將繼續(xù)存在。
深度學(xué)習(xí)云平臺解決方案
制造行業(yè)的機(jī)器視覺團(tuán)隊(duì)需要新的方法來實(shí)施深度學(xué)習(xí)機(jī)器視覺,云技術(shù)便是其中一種新方法。基于云的機(jī)器視覺平臺可讓用戶從多個地點(diǎn)(包括生產(chǎn)地點(diǎn)、國家和地區(qū))安全地上傳、標(biāo)記和標(biāo)注數(shù)據(jù)。在云平臺上匯集來自不同地點(diǎn)和環(huán)境的大量多樣化數(shù)據(jù),更有利于深度學(xué)習(xí)的訓(xùn)練。此類平臺可以讓指定的用戶開展實(shí)時(shí)協(xié)作,共同完成標(biāo)注、訓(xùn)練和測試項(xiàng)目并共享他們的專業(yè)知識。
與許多行業(yè)一樣,制造商也面臨著招聘和留用資深機(jī)器視覺專家的挑戰(zhàn)。試想一下,假如一家企業(yè)能夠更加輕松地利用某個生產(chǎn)地點(diǎn)、國家或地區(qū)的個人和團(tuán)隊(duì)的技能與專業(yè)知識,使所有人受益,尤其是在機(jī)器視覺人才稀少的地方,這將帶來多大的益處。協(xié)作型的云平臺將實(shí)現(xiàn)這一愿景。
基于云的解決方案還實(shí)現(xiàn)了算力的可擴(kuò)展性與可訪問性。在使用傳統(tǒng)系統(tǒng)的情況下,只有一部分特定員工的電腦配備了非常強(qiáng)大的GPU卡以執(zhí)行大型訓(xùn)練任務(wù)。而通過云技術(shù),每個用戶都可以通過各自的設(shè)備獲得同樣高的算力。雖然這會產(chǎn)生一些成本,但通過按需付費(fèi)的訂閱模式可能會比企業(yè)投資更多服務(wù)器和雇用更多難得的IT人員更有利。
借助云平臺,具有特定角色、權(quán)限和職責(zé)的用戶便可以在云端訓(xùn)練和測試深度學(xué)習(xí)模型。借助更優(yōu)質(zhì)的訓(xùn)練和測試數(shù)據(jù),在某些場景中,這些模型可能提供遠(yuǎn)超基于規(guī)則的傳統(tǒng)機(jī)器視覺的視覺檢測分析水平和精度。這也正是汽車、電池、半導(dǎo)體、電子和包裝等行業(yè)的制造商所追求的。
通過軟件即服務(wù)模式,機(jī)器視覺團(tuán)隊(duì)可以靈活、便捷地購買云平臺的訂閱服務(wù),同時(shí)不斷獲得技術(shù)合作伙伴更新的功能和模型。借助基于云的深度學(xué)習(xí)平臺,用戶或團(tuán)隊(duì)無論位于何處,都能夠在個人電腦和設(shè)備上將模型部署到邊緣,從而為生產(chǎn)線上的靈活數(shù)字化工作流程提供助力。
想要機(jī)器視覺系統(tǒng)能夠更好地工作并實(shí)現(xiàn)更多功能,我們需要以新的方式實(shí)施、使用和部署這項(xiàng)技術(shù),而深度學(xué)習(xí)云平臺正為AI機(jī)器視覺管理者指明了前進(jìn)的方向。
作者:斑馬技術(shù)大中華區(qū)技術(shù)總監(jiān) 程寧