加入星計劃,您可以享受以下權(quán)益:

  • 創(chuàng)作內(nèi)容快速變現(xiàn)
  • 行業(yè)影響力擴(kuò)散
  • 作品版權(quán)保護(hù)
  • 300W+ 專業(yè)用戶
  • 1.5W+ 優(yōu)質(zhì)創(chuàng)作者
  • 5000+ 長期合作伙伴
立即加入
  • 正文
    • AI變強(qiáng),成敗蕭何
    • 語音應(yīng)用駛?cè)肷钏畢^(qū),持續(xù)拷問商業(yè)化能力
    • 開放環(huán)境下,AI推理仍需突破
    • 寫在最后
  • 推薦器件
  • 相關(guān)推薦
  • 電子產(chǎn)業(yè)圖譜
申請入駐 產(chǎn)業(yè)圖譜

2022:看見AI萬分之一的“不可為”

2022/12/23
2083
閱讀需 14 分鐘
加入交流群
掃碼加入
獲取工程師必備禮包
參與熱點(diǎn)資訊討論

即將告別五味雜陳的2022年,站在AI產(chǎn)業(yè)的角度去回顧、總結(jié),今年很想做一篇“不一樣”的內(nèi)容。

我們追尋了很多AI的超能力,AI的賦能作用,AI的智能價值……那么,有哪些事情是AI做不了的?可能是因?yàn)榧夹g(shù)還需要突破,這是我們未來的創(chuàng)新點(diǎn);可能是因?yàn)閼?yīng)用需求還不成熟,需要時間沉淀和產(chǎn)業(yè)界的共同努力;可能是因?yàn)槌杀静粔蚪?jīng)濟(jì),還需要在商業(yè)落地環(huán)境中進(jìn)一步打磨;也可能,確實(shí)存在一些AI在短期內(nèi)甚至長期來看都無法替代的領(lǐng)域……

只有找到產(chǎn)業(yè)的剛需,找到AI的自驅(qū)力,看到AI應(yīng)用的邊界,明白AI的“有所為”和“有所不為”,我們對于AI的理解,以及對于AI落地的動力和方向才會更為清晰。

在這篇年終特寫中,<與非網(wǎng)>對話幾位AI產(chǎn)業(yè)人士,他們之中有工程師、有企業(yè)高管、有剛參加工作的新人,也有大廠出身抽離AI的資深人士……從另一個角度,他們解讀了AI。

AI變強(qiáng),成敗蕭何

湯煒偉從事人工智能芯片及相關(guān)產(chǎn)品的開發(fā)落地工作,對于“AI的智能價值,以及AI賦能行業(yè)的價值”,他的理解是,AI賦能行業(yè)——本質(zhì)上是生產(chǎn)力的提升,俗稱“降本增效”,在行業(yè)中提升生產(chǎn)效率,或者節(jié)省成本、釋放人力。

這一輪AI的爆發(fā),如果從2016的AlphaGo算起,也有六七年時間了。這些年里,大量的AI技術(shù)爆發(fā)并得到了應(yīng)用,如互聯(lián)網(wǎng)、安防、消費(fèi)電子、機(jī)器人、智能制造等。“這是一次新的生產(chǎn)力革命,在不同領(lǐng)域的降本增效都有著不俗表現(xiàn),也催生了很多商業(yè)模式和創(chuàng)業(yè)公司的出現(xiàn)”,湯煒偉表示。

他列舉了大家都熟悉的例子,如:計算機(jī)視覺中的人臉識別、車輛識別技術(shù),這些應(yīng)用達(dá)到了大體量的大型底庫下的高識別率——這就相當(dāng)于用計算機(jī)和機(jī)器部署了很多雙“慧眼”和后臺對應(yīng)的“記憶力”和“智腦”,替代了警察、保安等人為的繁重工作,并且顯著提高了安全保障效率。

再比如工業(yè)機(jī)器視覺,在生產(chǎn)線上以高速攝像頭加上AI智能識別,相比于傳統(tǒng)上人工判斷生產(chǎn)缺陷的方式,帶來了多倍的生產(chǎn)效率提升,并且避免了人為的疲勞帶來的誤判,充分發(fā)揮了機(jī)器的高準(zhǔn)確率,以及在相對單調(diào)的任務(wù)上不知疲倦的特性等。

此外還有互聯(lián)網(wǎng)推薦,如抖音、快手等短視頻推薦,對于用戶的娛樂體驗(yàn)帶來了無以倫比的感受。讓用戶沉浸于此的重要原因,就是推薦的內(nèi)容和用戶的心理、愛好等越來越高的匹配度,這背后是推薦算法越來越優(yōu)化的表現(xiàn)。

“然而,任何的單一技術(shù)都存在局限性和應(yīng)用的邊界”,湯煒偉指出。這一輪AI技術(shù)浪潮以深度神經(jīng)網(wǎng)絡(luò)為核心,它師承歷史的聯(lián)接學(xué)派,以設(shè)計不同的神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)來表達(dá)智能的能力。

那么,在這樣一種發(fā)展背景下,AI如何承上啟下,實(shí)現(xiàn)更強(qiáng)的AI?

湯煒偉表示,“產(chǎn)業(yè)界和學(xué)術(shù)界有一種觀點(diǎn),未來的AI智能技術(shù)也許是綜合了多種技術(shù)的組合,或者是一種全新的技術(shù)的顛覆才能帶來更強(qiáng)的AI?!?/p>

回歸到神經(jīng)網(wǎng)絡(luò)發(fā)展的三要素:數(shù)據(jù)、算法、算力,它們既成就了深度學(xué)習(xí)技術(shù),其實(shí)也在一定程度上限制了AI的發(fā)展。

首先是數(shù)據(jù),在神經(jīng)網(wǎng)絡(luò)的很多應(yīng)用領(lǐng)域需要海量的數(shù)據(jù)(可能是百萬級甚至千萬級),然而,并不是所有行業(yè)都能輕松獲得這樣量級的數(shù)據(jù)。數(shù)據(jù)要么是難以獲得(如人臉數(shù)據(jù)涉及隱私),要么是標(biāo)注成本極高(如醫(yī)療影像數(shù)據(jù)的標(biāo)注具有極高的專業(yè)度,醫(yī)生的專業(yè)時間則意味著極高成本),要么數(shù)據(jù)本身就是小數(shù)據(jù)(如工業(yè)元器件的表面缺陷,沒有海量的數(shù)據(jù))。 這些都給“數(shù)據(jù)”帶來了越來越多的挑戰(zhàn),迫使大家采用數(shù)據(jù)增強(qiáng)、對抗網(wǎng)絡(luò)等方法來解決或者緩解數(shù)據(jù)相關(guān)問題。

其次是算法,深度神經(jīng)網(wǎng)絡(luò)的參數(shù)量越來越大,如GPT-3的1750億參數(shù),這樣海量規(guī)模的算法的訓(xùn)練和收斂、數(shù)據(jù)輸入輸出,以及算法的部署等,都帶來了很大的成本挑戰(zhàn)。這其中包括顯性的算力、存儲、網(wǎng)絡(luò)等成本,也包括工程師的學(xué)習(xí)、熟悉、調(diào)試等大量的學(xué)習(xí)和開發(fā)成本。

第三是算力,雖然在眾多硬件廠商和生態(tài)圈的共同努力下,算力的單位成本在不斷下降。但是,應(yīng)對超大模型的算力成本,仍然是極為高昂的,如GPT-3,訓(xùn)練一次的成本可能高達(dá)數(shù)百萬美金。這樣高昂的成本,潛在將眾多資金不足的創(chuàng)業(yè)型公司攔在門檻之外,阻礙了他們應(yīng)用和發(fā)展大模型的能力。

除了三要素,湯煒偉認(rèn)為還有一點(diǎn)——就是當(dāng)前的AI系統(tǒng),對于環(huán)境感知的復(fù)雜性、對于智能處理分析和推理的綜合準(zhǔn)確性的提升,還有很大的提升空間。

例如環(huán)境感知的復(fù)雜性:在逆光、暗光等光線不佳情況下,難以獲得目標(biāo)的清晰圖像,自然很難得到神經(jīng)網(wǎng)絡(luò)的正常處理。再比如智能處理分析的完備性,如:智能門鎖貓眼觀察到的外部人員,如何判斷他是想進(jìn)門,還是經(jīng)過,亦是徘徊或者有破壞等不良意圖,這些都有待于多種傳感器、更聰明的算法和軟件邏輯的組合技術(shù)去進(jìn)一步突破。

此外,AI系統(tǒng)依賴于“數(shù)據(jù)/經(jīng)驗(yàn)”,會導(dǎo)致它對沒見過的corner case難以處理?!斑@方面可以舉出很多例子,如掃地機(jī)對于纖細(xì)型電源線的難以識別,自動駕駛系統(tǒng)對于一些交通意外的難以理解和識別等”,湯煒偉表示,“如果要探討AI的‘不可為’,其實(shí)是有時間和空間的限制的,云端AI越來越強(qiáng)大,就像最近很火的chat GPT,但在端側(cè)想實(shí)現(xiàn)這種實(shí)時性的互動,難度還是很大的。既要看到現(xiàn)在所處的現(xiàn)實(shí),也要從‘不起眼’的突破中找到變強(qiáng)的力量”。

語音應(yīng)用駛?cè)肷钏畢^(qū),持續(xù)拷問商業(yè)化能力

深聰智能董事長周偉達(dá)表示,人工智能確實(shí)受到了很大的關(guān)注,也取得了一定的成果。對于“AI的不可為”,他從宏觀和微觀兩個角度分享了自己的洞察。

從宏觀角度來看,需要明確AI在當(dāng)前承擔(dān)的角色,它被人類創(chuàng)造并服務(wù)于大眾生活、企業(yè)增效。在這一進(jìn)化過程中,它雖然不斷進(jìn)行著升級和完善,但始終無法進(jìn)行有效的道德判斷和情感思考,相對于真實(shí)的人類而言,它依舊有些“高冷”。

從微觀角度來看,從人工智能行業(yè)的落地來看,對“不可為”的這種看法或許來自目前的商業(yè)化落地程度,這也是整個行業(yè)和產(chǎn)業(yè)都在關(guān)注的問題。

深聰智能作為思必馳旗下的語音芯片設(shè)計公司,正面臨著智能語音應(yīng)用駛?cè)肷钏畢^(qū)的局面,一方面需要在場景端進(jìn)行商業(yè)化拓展,另一方面仍需在技術(shù)領(lǐng)域繼續(xù)投入,來適應(yīng)復(fù)雜場景的需求?!吧虡I(yè)化探索”是智能語音繼續(xù)向前發(fā)展需要解決的一個問題,既需要與傳統(tǒng)產(chǎn)業(yè)融合,又需要解決新興市場剛需和產(chǎn)品方案的配套問題。

不管是傳統(tǒng)還是新興應(yīng)用領(lǐng)域,商業(yè)化的探索并不容易,特別是要在多個行業(yè)同步推進(jìn)的情況下,基于技術(shù)構(gòu)建系統(tǒng)解決方案的能力、渠道能力、實(shí)現(xiàn)精準(zhǔn)卡位的能力、持續(xù)盈利的能力……對智能語音的落地都至關(guān)重要。

此外,在芯片與算法融合發(fā)展的趨勢下,如何研發(fā)出更高性能、更低功耗的語音芯片;以及在多模態(tài)融合發(fā)展的態(tài)勢下,如何進(jìn)一步挖掘市場需求和底層技術(shù)能力,都是智能語音企業(yè)構(gòu)筑競爭壁壘的關(guān)鍵。

目前,深聰智能語音芯片已經(jīng)在黑白電、小家電、車載硬件、會議辦公設(shè)備等多個場景得到了應(yīng)用,不僅為大眾生活提供了語音交互體驗(yàn),也為企事業(yè)單位提供了降本增效的服務(wù),應(yīng)用邊界在逐步拓寬。

放眼整個AI領(lǐng)域也是如此,很多企業(yè)都在打通各類資源,協(xié)同上下游產(chǎn)業(yè),都在為AI技術(shù)的落地和應(yīng)用不斷努力。周偉達(dá)樂觀認(rèn)為,現(xiàn)在的“不可為”,在未來一段時間會變?yōu)椤按笥锌蔀椤保@意味著市場空間將會帶來不錯的機(jī)遇。同時,作為AI領(lǐng)域的從業(yè)者,作為技術(shù)型企業(yè),通過協(xié)同上下游的產(chǎn)品需求、方案優(yōu)化、實(shí)踐部署等環(huán)節(jié),可以加速AI的商業(yè)化落地和應(yīng)用。

開放環(huán)境下,AI推理仍需突破

保險行業(yè)正處在數(shù)字化轉(zhuǎn)型的關(guān)口,嘗試用各種科技智能手段降本增效。車險理賠領(lǐng)域,兼具理賠業(yè)務(wù)本身的流程規(guī)范和定核損環(huán)節(jié)智能化程度有待提升的特點(diǎn),使得行業(yè)人士認(rèn)為,可以嘗試用AI解決一些共性問題,例如通過圖像/視頻理賠,盡量減少人工,提高效率。

當(dāng)前的理賠流程是,理賠人員需要人工確認(rèn)車輛損失、審核必要證件,所以為了提高效率,行業(yè)嘗試用AI視覺來充當(dāng)人的眼睛和大腦,一個核心的攻關(guān)場景就是智能定損。

劉金龍是中國人保的一名AI算法工程師,在他看來,“對于開放環(huán)境的事件處理,AI是缺乏原理理解能力的,因此對于無法窮舉的開放場景工作任務(wù),目前還是難以勝任的?!?/p>

這背后的邏輯是——人工智能是一定規(guī)則下的智能,而開放環(huán)境打破了特定的規(guī)則,由于開放環(huán)境的數(shù)據(jù)來源不穩(wěn)定,一旦出現(xiàn)特征不足的數(shù)據(jù),就難以智能起來。

以車險理賠場景的一個實(shí)際事件為例。當(dāng)前都是通過圖像實(shí)現(xiàn)車輛的定損操作,但圖像是由車主或修理廠人員拍攝的,難免出現(xiàn)不規(guī)范操作,如果圖像拍攝得過于局部,AI就無法判斷損傷所述部件(如下圖)。這時,AI就可能會給出一個很混亂的結(jié)果,無法非常準(zhǔn)確地完成任務(wù)。

究其主要原因,還是因?yàn)閳鼍胺浅i_放、圖像來源沒有約束性,一旦出現(xiàn)AI未學(xué)習(xí)過(數(shù)據(jù)特征不足)的情形,AI便“不可為”。 劉金龍表示,“AI完成工作的前提是:預(yù)設(shè)規(guī)則,對于無法窮舉所有規(guī)則的事件就會表現(xiàn)出不夠智能的一面,主要還是因?yàn)锳I對于開放環(huán)境中基于原理的推理能力是不足的?!?/p>

除此之外,劉金龍認(rèn)為在需要投入感情(情感)的工作方面,還只能作為一種輔助工具來運(yùn)用。

例如教書育人,需要教師用心、用情去認(rèn)知每一個學(xué)生,然后根據(jù)不同學(xué)生的特點(diǎn),用不同的方法引導(dǎo)學(xué)生打開心中疑問;教師也需要以身作則,幫助學(xué)生樹立正確的價值觀、人生觀。同時,教育需要理解事物的原理,剖析其中的真諦,但AI目前是只接受結(jié)果不可解釋過程的一項技術(shù),是無法把事物的本質(zhì)展現(xiàn)給學(xué)生的。而學(xué)生學(xué)習(xí)的目的卻是理解事物的本質(zhì),進(jìn)而舉一反三、融會貫通。

其次在老年人的陪護(hù)方面,需要一個有情感的人去交流、去陪伴,而不是冷冰冰的機(jī)器人的簡單對話,或是機(jī)械地輔助自理生活。

再比如法律工作,“法律無情,人有情”,在處理法律工作的過程中并不全部是依據(jù)法律條文一一定責(zé)的過程,而是法律、事實(shí)和情感的交互過程,進(jìn)而交融出一個合理的結(jié)果。

“以上都不僅僅是經(jīng)驗(yàn)主義,也不是程序化工作,也沒有辦法數(shù)字化。因此,這些目前均不適合AI來獨(dú)立完成”, 劉金龍說道。

寫在最后

我們向往AI更智能,幫助我們“躺平”。但正如本文三位產(chǎn)業(yè)人士所探討,從AI本身的原理和特性、AI落地的商業(yè)化探索,AI與實(shí)際場景交融的短板來看,總還是有那么一些“不可為”。

就像萬里星光中,還尚且朦朧的點(diǎn)滴光亮,照亮了AI的真相和方向。

推薦器件

更多器件
器件型號 數(shù)量 器件廠商 器件描述 數(shù)據(jù)手冊 ECAD模型 風(fēng)險等級 參考價格 更多信息
ATXMEGA256A3BU-MH 1 Microchip Technology Inc IC MCU 8BIT 256KB FLASH 64QFN

ECAD模型

下載ECAD模型
$5.86 查看
STM32F429VIT6 1 STMicroelectronics High-performance advanced line, Arm Cortex-M4 core with DSP and FPU, 2 Mbytes of Flash memory, 180 MHz CPU, ART Accelerator, Chrom-ART Accelerator, FSMC, TFT

ECAD模型

下載ECAD模型
$34.08 查看
DSPIC33EP512MU814-E/PH 1 Microchip Technology Inc 16-BIT, FLASH, 60 MHz, MICROCONTROLLER, PQFP144, 16 X 16 MM, 1 MM HEIGHT, LEAD FREE, PLASTIC, TQFP-144

ECAD模型

下載ECAD模型
$11.85 查看

相關(guān)推薦

電子產(chǎn)業(yè)圖譜

與非網(wǎng)資深行業(yè)分析師。主要關(guān)注人工智能、智能消費(fèi)電子等領(lǐng)域。電子科技領(lǐng)域?qū)I(yè)媒體十余載,善于縱深洞悉行業(yè)趨勢。歡迎交流~