導(dǎo)? 讀:TinyML 是指在毫瓦(mW)功率范圍以下的設(shè)備上,實(shí)現(xiàn)機(jī)器學(xué)習(xí)的方法、工具和技術(shù)。這里的關(guān)鍵詞是“毫瓦功率范圍以下的設(shè)備”。TinyML 功耗極低,不僅適用于邊緣硬件,還可用于物聯(lián)網(wǎng)終端設(shè)備,支持各種不同的電池驅(qū)動(dòng)的設(shè)備,和需要始終在線的應(yīng)用。最近 TinyML 與 AutoML 正在快速融合,構(gòu)建嵌入式自動(dòng)化機(jī)器學(xué)習(xí)算法,發(fā)揮更大的效力。
? ??
AIoT 智聯(lián)網(wǎng)是 AI(人工智能)和 IoT(物聯(lián)網(wǎng))技術(shù)在實(shí)際應(yīng)用中的落地融合。近年來,智聯(lián)網(wǎng) AIoT 一詞熱度劇增,她正在以極快的速度從襁褓中的嬰兒長大成人。
昨天,All inAIoT 還是單個(gè)企業(yè)的市場(chǎng)宣言;今天,AIoT in All 已經(jīng)成為各行各業(yè)嘗試轉(zhuǎn)型以及尋找下一增長點(diǎn)的主力。
根據(jù)中國信息通信研究院統(tǒng)計(jì)預(yù)測(cè)數(shù)據(jù)顯示,2020 年全球人工智能市場(chǎng)將達(dá)到 6800 億元人民幣。據(jù)研究機(jī)構(gòu) Markets and Markets 在 2019 年發(fā)布的報(bào)告稱,2019 年全球 AIoT 市場(chǎng)規(guī)模為 51 億美元。到 2024 年,這一數(shù)字將增長至 162 億美元,復(fù)合年增長率為 26.0%。
AIoT 的成熟,一方面需要企業(yè)的重視與投入,另一方面需要技術(shù)的支撐與迭代。上周,我們談到阿里投百億加速 AIoT 布局的“大手筆”;這周,我們來看看 AIoT 的領(lǐng)域吹起的技術(shù)“新風(fēng)向”。
在文章《一文讀懂即將引爆的 TinyML:在邊緣側(cè)實(shí)現(xiàn)超低功耗機(jī)器學(xué)習(xí)》中,我曾經(jīng)介紹過一個(gè)新趨勢(shì):TinyML,并提到將會(huì)持續(xù)追蹤 TinyML 的進(jìn)展。
TinyML 是指在毫瓦(mW)功率范圍以下的設(shè)備上,實(shí)現(xiàn)機(jī)器學(xué)習(xí)的方法、工具和技術(shù)。這里的關(guān)鍵詞是“毫瓦功率范圍以下的設(shè)備”。TinyML 功耗極低,不僅適用于邊緣硬件,還可用于物聯(lián)網(wǎng)終端設(shè)備,支持各種不同的電池驅(qū)動(dòng)的設(shè)備,和需要始終在線的應(yīng)用。
這些設(shè)備包括智能攝像頭、遠(yuǎn)程監(jiān)控設(shè)備、可穿戴設(shè)備、音頻采集硬件以及各種傳感器等…TinyML 是一個(gè)新興領(lǐng)域,是快速增長的機(jī)器學(xué)習(xí)技術(shù)和應(yīng)用,是一片巨大的、未被充分開發(fā)的藍(lán)海。
最近 TinyML 與 AutoML 正在快速融合,構(gòu)建嵌入式自動(dòng)化機(jī)器學(xué)習(xí)算法,發(fā)揮更大的效力。
AutoML 全稱是 Automated Machine Learning,自動(dòng)化機(jī)器學(xué)習(xí),這是 2014 年以來,機(jī)器學(xué)習(xí)和深度學(xué)習(xí)領(lǐng)域最炙手可熱的領(lǐng)域之一。
我們都知道,機(jī)器學(xué)習(xí)的應(yīng)用需要大量的人工干預(yù),這些人工干預(yù)表現(xiàn)在:特征提取、模型選擇、參數(shù)調(diào)節(jié)等各個(gè)方面。AutoML 試圖將這些與特征、模型、優(yōu)化、評(píng)價(jià)有關(guān)的重要步驟進(jìn)行自動(dòng)化地學(xué)習(xí),使得機(jī)器學(xué)習(xí)模型無需人工干預(yù)即可被應(yīng)用。
就在今年 3 月,谷歌證明了 AutoML 可以走得更遠(yuǎn)。根據(jù)谷歌已將代碼開源的 AutoML-Zero,如今有可能僅使用基本的數(shù)學(xué)運(yùn)算作為構(gòu)建塊,就可以自動(dòng)“進(jìn)化”為完整的機(jī)器學(xué)習(xí)算法。
因此本文將介紹 TinyML 與 AutoML 相結(jié)合的最新進(jìn)展,值得你關(guān)注的包括:
TinyML 與 AutoML“攜手”的最大價(jià)值體現(xiàn)在哪里?
嵌入式自動(dòng)化機(jī)器學(xué)習(xí)算法的具體應(yīng)用場(chǎng)景有哪些?
這個(gè)領(lǐng)域的初創(chuàng)公司和各類資源的情況如何?
01
TinyML+ AutoML 的價(jià)值何在?
21 世紀(jì)最性感的工作是什么?
你可能已經(jīng)腦補(bǔ)了五花八門的答案,但《哈佛商業(yè)評(píng)論》(Harvard Business Review)認(rèn)為是“數(shù)據(jù)科學(xué)家”。HBR 在文章中寫道,“如果‘性感’意味著擁有非常搶手的稀有品質(zhì),那么數(shù)據(jù)科學(xué)家就是?!?/p>
數(shù)據(jù)科學(xué)家很難招到、工資很高、更難留住,這也許是每個(gè)試圖嘗試 AI 應(yīng)用的物聯(lián)網(wǎng)企業(yè)都會(huì)頭疼的問題。
數(shù)據(jù)顯示,在 2018 年,初級(jí)數(shù)據(jù)科學(xué)家的平均工資為 11.5 萬美元 / 年,能夠管理 10 至 15 人團(tuán)隊(duì)的數(shù)據(jù)科學(xué)家則可以拿到 35 萬美元的年薪。
2019 年,全球?qū)?shù)據(jù)科學(xué)家的需求量是供應(yīng)量的 1.5 倍。超過 40%的公司認(rèn)為招聘不到數(shù)據(jù)科學(xué)家是嚴(yán)重阻礙他們競爭力的原因之一。超過 60%的公司試圖通過內(nèi)部培訓(xùn),讓現(xiàn)有員工變身成為數(shù)據(jù)科學(xué)家。
在物聯(lián)網(wǎng)領(lǐng)域,數(shù)據(jù)科學(xué)家除了稀有,還面臨另一個(gè)問題:在物聯(lián)網(wǎng)終端,很多 AI 絕技無法施展。分布最廣的物聯(lián)網(wǎng)設(shè)備往往體積很小、電量有限。它們被作為終端硬件,通過嵌入式傳感器采集各種數(shù)據(jù);計(jì)算能力有限,對(duì)功耗極為敏感。物聯(lián)網(wǎng)領(lǐng)域占比超過 95%以上,都是需要超低功耗、占用極少存儲(chǔ)空間、完成實(shí)時(shí)數(shù)據(jù)處理的場(chǎng)景。能夠在這類設(shè)備上實(shí)現(xiàn)機(jī)器學(xué)習(xí)的人才,更是精英中的高階精英。
TinyML 與 AutoML“攜手”,就是試圖讓物聯(lián)網(wǎng)領(lǐng)域的機(jī)器學(xué)習(xí),突破人才稀缺和硬件受限的掣肘,讓機(jī)器學(xué)習(xí)算法在物聯(lián)網(wǎng)終端自我進(jìn)化,讓非技術(shù)人員可以輕松的使用人工智能進(jìn)行數(shù)據(jù)分析,讓原本“物以稀為貴”的機(jī)器學(xué)習(xí)以親民的方式“飛入百姓家”。
02
什么是 AutoML?
為了更好的理解 AutoML,清華校友翟偉所在公司 Qeexo 通過一個(gè)有趣的對(duì)比進(jìn)行了解釋。
在某種程度上,人工智能與印刷術(shù)非常相似,它們的誕生都是人類歷史上的巨大轉(zhuǎn)折,而且演進(jìn)過程也有一定的可比性。
印刷術(shù)發(fā)明之前,文化的傳播主要靠手抄的書籍。手抄費(fèi)時(shí)、費(fèi)事,又容易抄錯(cuò)、抄漏,既阻礙了文化的發(fā)展,又給文化的傳播帶來不應(yīng)有的損失。
就像在人工智能誕生之前,工程師們要自己寫計(jì)算程序完成數(shù)據(jù)分析,不僅效率低而且有可能存在很多誤判。
印章和石刻給印刷術(shù)提供了直接的經(jīng)驗(yàn)性啟示,用紙?jiān)谑夏氐姆椒ǎ苯訛榈癜嬗∷⒅该髁朔较颉?/p>
雕版印刷的版料,一般選用紋質(zhì)細(xì)密堅(jiān)實(shí)的木材,然后把木材鋸成一塊塊木板,把要印的字寫在薄紙上,反貼在木板上,再根據(jù)每個(gè)字的筆劃,用刀一筆一筆雕刻成陽文,使每個(gè)字的筆劃突出在板上。木板雕好以后,就可以印書了。
就像在人工智能的初始階段,工程師們?yōu)槊總€(gè)用例,從零開始寫機(jī)器學(xué)習(xí)的代碼,一個(gè)用例對(duì)應(yīng)一塊“雕版”,在不同用例之間代碼很難重復(fù)利用,靈活性差、對(duì)工程師的技藝要求高。
活字制版避免了雕版的不足,只要事先準(zhǔn)備好足夠的單個(gè)活字,就可隨時(shí)拼版,大大地加快了制版時(shí)間。活字版印完后,可以拆版,活字可重復(fù)使用,且活字比雕版占有的空間小,容易存儲(chǔ)和保管。這樣活字的優(yōu)越性就表現(xiàn)出來了。
就像隨著人工智能的發(fā)展,工程師們開始使用解耦的思維,使用現(xiàn)有的機(jī)器學(xué)習(xí)模塊與框架活用拼湊 AI。這個(gè)階段開發(fā)一個(gè)上手的應(yīng)用或許很簡單,但是要開發(fā)真正的產(chǎn)品卻很難,需要一個(gè)團(tuán)隊(duì)的專業(yè)人士,花費(fèi)幾個(gè)星期的時(shí)間完成。
而現(xiàn)在,我們每個(gè)人都知道如何使用電腦打字,并使用打印機(jī)將文稿印出。
AutoML 就是試圖將人工智能也帶入到同樣階段的做法,讓一位非專業(yè)人士,花費(fèi)幾分鐘的時(shí)間,即可完成多個(gè)人工智能模型。在這個(gè)階段,合適的 AutoML 工具是關(guān)鍵。
谷歌最近發(fā)布了一篇論文名為《AutoML-Zero:從零開始的自動(dòng)機(jī)器學(xué)習(xí)》,AutoML-Zero:Evolving Machine Learning Algorithms From Scratch。
AutoML-Zero 這個(gè)名字難免讓人產(chǎn)生聯(lián)想。當(dāng)年 AlphaGo 戰(zhàn)勝了人類最強(qiáng)棋手,但前提是它先學(xué)會(huì)了人類棋譜,離不開人類指導(dǎo)。接著谷歌又推出了 AlphaGo Zero,只讓 AI 知道圍棋規(guī)則,從零開始學(xué)下棋,結(jié)果再次登上棋藝頂峰。
AutoML-Zero 似乎想要證明,既然 AI 能從零學(xué)習(xí)圍棋,也可以從零開始摸索機(jī)器學(xué)習(xí)算法。
谷歌這篇論文的全文可以通過文末的提示下載閱讀。
現(xiàn)在谷歌已將 AutoML-Zero 的開源程序提交到 GitHub,普通電腦只需 5 分鐘就能體驗(yàn)一下它的實(shí)際效果。GitHub 網(wǎng)址:
https://github.com/google-research/google-research/tree/master/automl_zero
03
應(yīng)用場(chǎng)景有哪些?
目前一些智能可穿戴設(shè)備,包括智能耳機(jī)和智能手表已經(jīng)在使用相關(guān)技術(shù)。通過加速度傳感器和陀螺儀輔以相應(yīng)的嵌入式自動(dòng)化機(jī)器學(xué)習(xí)算法,可以更好的分析用戶行為,并且支持自定義手勢(shì)創(chuàng)建、情境感知、活動(dòng)分類、步態(tài)分析,提供更加貼合用戶自身的服務(wù)。
智能家居也是應(yīng)用場(chǎng)景之一。智能水壺和智能灶臺(tái)可以通過聲學(xué)傳感器和算法,檢測(cè)水是否燒開、燒開的水是否溢出、壺和鍋的溫度有沒有過高。還可以監(jiān)測(cè)智能微波爐中的玉米花是否爆開,以便及時(shí)關(guān)閉設(shè)備。
當(dāng)然,你也許會(huì)想,這些場(chǎng)景都是“小兒科”,只有在最復(fù)雜的工業(yè)場(chǎng)景中實(shí)現(xiàn)應(yīng)用,才能驗(yàn)證“TinyML+AutoML”嵌入式自動(dòng)化機(jī)器學(xué)習(xí)算法真正有效。如你所料,有些企業(yè)正在將嵌入式機(jī)器學(xué)習(xí)自動(dòng)算法用于預(yù)測(cè)性維護(hù)。
對(duì)于預(yù)測(cè)性維護(hù)(PDM)的發(fā)展階段進(jìn)行簡單劃分,可分為 4 個(gè)階段:
PDM 1.0—反應(yīng)性維護(hù):當(dāng)問題出現(xiàn)時(shí)再來解決它,例如救火。
PDM 2.0—預(yù)防性維護(hù):包括外觀檢測(cè),以及能夠提供更具體、更客觀的有關(guān)機(jī)器或系統(tǒng)狀況相關(guān)信息的定期資產(chǎn)檢測(cè)。
PDM 3.0—基于規(guī)則的預(yù)測(cè)性維護(hù):也就是“狀態(tài)監(jiān)測(cè)”。傳感器持續(xù)收集來自設(shè)備的數(shù)據(jù),并根據(jù)預(yù)先設(shè)定的規(guī)則,包含在預(yù)先設(shè)定的臨界值出現(xiàn)時(shí)發(fā)出警報(bào)。
PDM 4.0—基于機(jī)器學(xué)習(xí)的預(yù)測(cè)性維護(hù):依靠大量的歷史數(shù)據(jù)或者測(cè)試數(shù)據(jù),結(jié)合為不同情境定制的機(jī)器學(xué)習(xí)算法,預(yù)測(cè)錯(cuò)誤出現(xiàn)的時(shí)間和位置,然后發(fā)出警報(bào)。
PDM 4.0 是通過先進(jìn)的分析技術(shù)對(duì)資產(chǎn)的技術(shù)條件、使用、環(huán)境、維修歷史、其他類似設(shè)備以及任何可能與之相關(guān)的大數(shù)據(jù)進(jìn)行分析,預(yù)測(cè)未來將會(huì)發(fā)生的故障,并最終制定出最有效的預(yù)防措施。
在這個(gè)過程中,聽聲能力很重要,就像維護(hù)維修專家能夠通過汽車引擎的聲音,來診斷車輛的問題一樣,工業(yè)設(shè)備如果擁有了一雙遠(yuǎn)程的“順風(fēng)耳”,結(jié)合振動(dòng)分析,就可以讓 PDM 方案更精確。聲音同樣還能被用于診斷液體泄露、管道腐蝕和液位測(cè)量。
PDM4.0 還面臨一個(gè)規(guī)模化應(yīng)用的窘境,由于每個(gè)設(shè)備的安裝條件、載重性能和外部環(huán)境都不相同,單一的 AI 模型可能無法在類似的電機(jī)上批量復(fù)制。
TinyML+AutoML 使用時(shí)間序列傳感器,包括模擬和數(shù)字麥克風(fēng),可以自適應(yīng)的創(chuàng)建 AI 模型。通過聲音傳感與分析,有助于識(shí)別預(yù)測(cè)性維護(hù)應(yīng)用的問題。
04
初創(chuàng)公司&各類資源
關(guān)于 TinyML+AutoML,有很多現(xiàn)成的工具和軟件可以使用,物聯(lián)網(wǎng)企業(yè)不需要招聘昂貴的數(shù)據(jù)科學(xué)家,也不需要擴(kuò)充團(tuán)隊(duì),就可以初步嘗試。
這里介紹比較有代表性的初創(chuàng)公司和資源,包括 QEEXO、MindsDB 和 Cartesiam。
QEEXO
這家公司成立于 2012 年,總部位于加利福尼亞州山景城,機(jī)器學(xué)習(xí)的研發(fā)團(tuán)隊(duì)位于賓夕法尼亞州匹茨堡,在北京和上海擁有工程師團(tuán)隊(duì)。
目前已經(jīng)有 260 多種硬件平臺(tái),超過 3 億臺(tái)設(shè)備,搭載了 QEEXO 的機(jī)器學(xué)習(xí)引擎。
知名的包括在華為手機(jī)中嵌入的指關(guān)節(jié)操作技術(shù)。
指關(guān)節(jié)操作功能通過使用指關(guān)節(jié)在屏幕上敲擊或勾畫,快速調(diào)用系統(tǒng)功能,支持利用指關(guān)節(jié)雙擊全屏截屏、敲擊并畫圈局部截屏、敲擊并畫字母 S 滾動(dòng)截屏、雙指關(guān)節(jié)雙擊錄屏、直線分屏等 5 種手勢(shì)操作。今年 5 月,榮耀發(fā)布了新機(jī)榮耀 X10,指關(guān)節(jié)操作功能首次下放給了“千元機(jī)”。
QEEXO 與瑞薩電子等領(lǐng)先硬件廠商進(jìn)行合作,完成了多種硬件的適配。QEEXO 可支持 Arm Cortex – M0 到 M4 核的單片機(jī),如瑞薩 RA6M3 組單片機(jī)產(chǎn)品。
據(jù)悉,QEEXO 的自動(dòng)機(jī)器學(xué)習(xí)算法將在亞馬遜 AWS 上架,以 SaaS 年度訂閱的方式提供服務(wù),并將在下周周一,6 月 8 日進(jìn)行全球商用版 Qeexo AutoML 的正式發(fā)布。
MindsDB
MindsDB 公司成立于 2017 年,總部位于加利福尼亞州伯克利,源自美國加州大學(xué)伯克利分校的研究項(xiàng)目,其同名服務(wù)已在 GitHub 上發(fā)布開源版本。GitHub 網(wǎng)址:
https://github.com/mindsdb/mindsdb#mindsdb
最近 MindsDB 完成了一筆 300 萬美元的融資,用于擴(kuò)充團(tuán)隊(duì)和驗(yàn)證商業(yè)模式。
Cartesiam
Cartesiam 公司創(chuàng)立于 2016 年,總部位于法國土倫,商務(wù)運(yùn)營中心位于巴黎和紐約,主要實(shí)現(xiàn)讓普通的 ARM 微控制器都能運(yùn)行的無監(jiān)督學(xué)習(xí) AI。
今年 2 月,Cartesiam 發(fā)布了一個(gè)名為 NanoEdge AI Studio 的軟件系統(tǒng),該系統(tǒng)能夠安全地生成 AI 算法,并且生成的算法只需兩分鐘就可在 ARM 微處理器上運(yùn)行,容量大小僅為 4~16KB RAM。
法國的工業(yè)電子制造商 Eolane 與 Cartesiam 合作推出了一款名為 Bob Assistant 的溫度 / 振動(dòng)傳感器,主要用于預(yù)測(cè)工業(yè)維修。目前,該解決方案已經(jīng)被許多歐洲客戶所采用,成為首個(gè)大規(guī)模部署的工業(yè) 4.0 預(yù)測(cè)性維護(hù)解決方案。
5 月 19 日,Cartesiam 發(fā)布了針對(duì) STM32 開發(fā)板優(yōu)化的新版 NanoEdge AI Studio 軟件工具。STM32 是意法半導(dǎo)體開發(fā)的微控制器。新版提供一個(gè)新的硬件平臺(tái)選項(xiàng),讓開發(fā)者可以直接選擇意法半導(dǎo)體的 Nucleo-F401RE 或 Nucleo-L432KC 開發(fā)板。在選擇之后,用戶可以解鎖設(shè)計(jì)流程的最后一步,下載可在所選硬件平臺(tái)上立即運(yùn)行的自定義機(jī)器學(xué)習(xí)庫。
---- 寫在最后 ----
看似微小的 TinyML 和自我進(jìn)化的 AutoML 蘊(yùn)含大機(jī)會(huì),物聯(lián)網(wǎng)企業(yè)需要轉(zhuǎn)變的首先是思維,積極擁抱和勇于嘗試,或許就會(huì)開辟一番新天地。
【掃碼下方二維碼,下載論文《AutoML-Zero:從零開始的自動(dòng)機(jī)器學(xué)習(xí)》。】
最后,衷心感謝清華校友、QEEXO 中國區(qū)市場(chǎng)負(fù)責(zé)人翟偉在寫作過程中幫我提供的大量資料以及各種支持。6 月 8 日,QEEXO 嵌入式自動(dòng)化機(jī)器學(xué)習(xí)服務(wù)的商用版本即將正式發(fā)布,邀請(qǐng)你與我們共同見證。
本文總結(jié):
TinyML 與 AutoML 正在快速融合,構(gòu)建嵌入式自動(dòng)化機(jī)器學(xué)習(xí)算法。
TinyML 與 AutoML“攜手”,讓原本“物以稀為貴”的機(jī)器學(xué)習(xí)以親民的方式“飛入百姓家”。
嵌入式自動(dòng)化機(jī)器學(xué)習(xí)算法具有廣泛的應(yīng)用領(lǐng)域,包括智能家居硬件、智能可穿戴設(shè)備、建筑物振動(dòng)監(jiān)測(cè)和工業(yè)預(yù)測(cè)性維護(hù)。
這個(gè)領(lǐng)域中比較有代表性的初創(chuàng)公司和資源,包括 QEEXO、MindsDB 和 Cartesiam。
參考資料:
1. 一文讀懂即將引爆的 TinyML:在邊緣側(cè)實(shí)現(xiàn)超低功耗機(jī)器學(xué)習(xí)【物女心經(jīng)】,來源:物聯(lián)網(wǎng)智庫
2.ThisIs How Algorithms Will Evolve Themselves, by Courtney Linder, popularmechanics.com
3.Googleclaims new AutoML will ‘evolve’ without human intervention, techhq.com
4.ComparingMindsDB with Sklearn and Tensorflow, mindsdb.com
5.WhyTinyML is a giant opportunity, by TX ZHUO and FIKA VENTURES, venturebeat.com
6.QeexoAutoML is Now Live on Amazon Web Services, prweb.com
7.EtaCompute 與 EdgeImpulse 合作,以促進(jìn)邊緣端機(jī)器學(xué)習(xí)的開發(fā)和部署,times.hinet.net
8.BackingMindsDB - Automated Machine Learning for the Software Developer, by SamuelHields, blog.openocean.vc
9.STMicroelectronicsand Cartesiam announce general availability of NanoEdge AI Studio now optimizedfor STMicroelectronics development boards, cartesiam.ai
10.Why, Hello FPGA and AI - HowNice to See You Together, by Max Maxfield, eejournal.com
11.TOP AUTOML PLATFORMS TO LOOKOUT FOR IN 2020, by?Smriti Srivastava, analyticsinsight.net
12.Machine Learning at the Pushof a Button, by Jim Turley, eejournal.com
13.Do You Hear What I Hear?Connecting IoT Devices with Sound, engineering.com