加入星計(jì)劃,您可以享受以下權(quán)益:

  • 創(chuàng)作內(nèi)容快速變現(xiàn)
  • 行業(yè)影響力擴(kuò)散
  • 作品版權(quán)保護(hù)
  • 300W+ 專業(yè)用戶
  • 1.5W+ 優(yōu)質(zhì)創(chuàng)作者
  • 5000+ 長(zhǎng)期合作伙伴
立即加入
  • 正文
    • 1.谷歌:已適配手機(jī)AI助手Pixie,借助軟件為智能眼鏡提供搜索服務(wù)
    • 2.微軟:在HoloLens上運(yùn)行AI軟件,通過(guò)聊天機(jī)器人提供多模態(tài)語(yǔ)言
    • 4.Meta:已適配雷朋眼鏡,提供AI新功能
    • 5.亞馬遜:開(kāi)發(fā)新AI設(shè)備系列,或?yàn)橹悄苎坨R提供支持
    • 6.AI可穿戴設(shè)備+攝像頭,或成大模型最佳硬件載體
    • 7.結(jié)語(yǔ):科技巨頭尋求AI大模型最佳硬件載體
  • 推薦器件
  • 相關(guān)推薦
  • 電子產(chǎn)業(yè)圖譜
申請(qǐng)入駐 產(chǎn)業(yè)圖譜

AI新戰(zhàn)場(chǎng)打響!硅谷五巨頭瞄準(zhǔn)智能眼鏡

2023/12/19
1848
閱讀需 12 分鐘
加入交流群
掃碼加入
獲取工程師必備禮包
參與熱點(diǎn)資訊討論

編譯 |??徐珊,編輯?|??云鵬

大模型的下一場(chǎng)戰(zhàn)爭(zhēng):帶攝像頭智能眼鏡?

大模型之戰(zhàn)席卷了整個(gè)2023年,緊接著的是,各大科技巨頭似乎都瞄準(zhǔn)了AI可穿戴設(shè)備,尤其是智能眼鏡!

智東西12月18日消息,據(jù)The Information報(bào)道,Meta、谷歌、微軟、亞馬遜、蘋果五大科技巨頭都準(zhǔn)備將AI大模型應(yīng)用在智能眼鏡等帶有攝像頭的可穿戴設(shè)備上。他們認(rèn)為智能眼鏡等硬件將成為AI大模型的合適載體,因?yàn)槎嗄B(tài)AI大模型可以處理聲音、圖片、視頻等多類型的信息。

有知情人士透露,明星AI創(chuàng)業(yè)OpenAI最近也正在將“GPT-4 with Vision”的物體識(shí)別軟件嵌入到社交公司Snap的產(chǎn)品中。這或許將為Snap的智能眼鏡Spectacles提供新功能。

Meta在上周二展示了自己將AI功能融入至雷朋(Ray-Ban)智能眼鏡的效果。該智能眼鏡可以通過(guò)AI語(yǔ)音助手描述用戶看到哪些東西,同時(shí)能夠告訴用戶哪件襯衫適合哪件褲子,以及擁有西班牙語(yǔ)報(bào)紙翻譯成英語(yǔ)等一系列新功能。

亞馬遜Alexa AI助理團(tuán)隊(duì)內(nèi)同樣有個(gè)小組在研發(fā)一種新型帶有設(shè)覺(jué)功能的AI設(shè)備。此外,和多數(shù)手機(jī)廠商一樣,谷歌開(kāi)始嘗試將AI功能應(yīng)用到手機(jī)中。

不僅如此,今年6月,蘋果Vision Pro頭顯正式亮相,計(jì)劃在明年出售。但據(jù)The Information推測(cè),該設(shè)備可能剛開(kāi)始并不會(huì)具備多模態(tài)AI功能

當(dāng)一場(chǎng)新的移動(dòng)終端變革開(kāi)始,蘋果、微軟、谷歌、Meta等科技巨頭將會(huì)如何布局新的戰(zhàn)場(chǎng)?他們又是如何在各大硬件中凸顯出自己的AI優(yōu)勢(shì)?哪些新的AI硬件或成為AI大模型的最佳載體?我們通過(guò)最新爆料可以看到一場(chǎng)AI硬件創(chuàng)新戰(zhàn)正在開(kāi)始。

1.谷歌:已適配手機(jī)AI助手Pixie,借助軟件為智能眼鏡提供搜索服務(wù)

在上周剛剛發(fā)布的AI大模型Gemini中,展示了一段AI是如何根據(jù)模仿者的動(dòng)作,猜出電影名稱的視頻。它還展示了如何猜地圖、如何處理手工問(wèn)題等細(xì)節(jié)。

盡管視頻內(nèi)容可能有所編輯,但是該視頻也透出了谷歌想要傳達(dá)的基本思想:打造一款始終在線的AI,它可以通過(guò)人們?cè)诳?、在?tīng)的東西,給用戶直接的反饋或者幫助。一位直接了解谷歌消費(fèi)硬件戰(zhàn)略的人士表示,谷歌可能還需要數(shù)年時(shí)間才能提供這種體驗(yàn),因?yàn)檫@種實(shí)施基于環(huán)境的計(jì)算將會(huì)耗費(fèi)大量電力

現(xiàn)如今,谷歌正在重新設(shè)計(jì)其Pixel手機(jī)的操作系統(tǒng),希望嵌入較小規(guī)模的Gemini模型,為其手機(jī)AI助手Pixie升級(jí)體驗(yàn),比如說(shuō)告訴用戶周邊哪里可以買到他們剛剛拍攝下來(lái)的產(chǎn)品。

基于谷歌在搜索技術(shù)上長(zhǎng)期布局,The Information覺(jué)得基于周圍環(huán)境信息,學(xué)習(xí)和預(yù)測(cè)人們需要或想要的AI設(shè)備似乎非常適合谷歌。盡管十年前,谷歌眼鏡失敗了,但是谷歌后續(xù)也推動(dòng)安卓手機(jī)廠商們通過(guò)手機(jī)攝像頭掃描環(huán)境并將圖像推送到谷歌,然后基于云系統(tǒng)進(jìn)行分析,從而形成“Google Lens”的圖像搜索應(yīng)用程序。

了解該戰(zhàn)略的人士表示,該公司最近取消了眼鏡式設(shè)備的開(kāi)發(fā),但仍在為該類型的設(shè)備開(kāi)發(fā)軟件。這些人士表示,谷歌計(jì)劃將圖像搜索軟件授權(quán)給硬件制造商,類似于為三星等手機(jī)制造商開(kāi)發(fā)安卓移動(dòng)操作系統(tǒng)的方式,發(fā)揮其AI大模型的作用。

2.微軟:在HoloLens上運(yùn)行AI軟件,通過(guò)聊天機(jī)器人提供多模態(tài)語(yǔ)言

在多模態(tài)AI大模型的熱潮下,微軟研究人員和產(chǎn)品團(tuán)隊(duì)也開(kāi)始嘗試升級(jí)自己的語(yǔ)音助手,并且嘗試在一些小型設(shè)備上運(yùn)行AI功能。

根據(jù)專利申請(qǐng)顯示以及知情人士透露,其模型可以為一些平價(jià)的智能眼鏡或者其他硬件提供支持。微軟正計(jì)劃在其AR頭顯HoloLens上運(yùn)行AI軟件。用戶將頭顯前置攝像頭對(duì)準(zhǔn)物體,拍下照片發(fā)送給由OpenAI 驅(qū)動(dòng)的聊天機(jī)器人,讓聊天機(jī)器人直接識(shí)別物體。同時(shí),用戶還可以通過(guò)對(duì)話的方式,從聊天機(jī)器人這里獲得更多的信息。

3.蘋果:Vision Pro發(fā)布時(shí)或不會(huì)搭載AI大模型

蘋果Vision Pro擁有不少多模態(tài)的新功能,但AI大模型方面的進(jìn)展,和其他幾家相比略有落后。目前,沒(méi)有任何跡象表明Vision Pro在發(fā)布時(shí)將擁有復(fù)雜的物體識(shí)別或其他多模態(tài)AI功能。

但蘋果花了數(shù)年時(shí)間完善Vision Pro的計(jì)算機(jī)視覺(jué)功能,以便該設(shè)備能夠快速識(shí)別周圍環(huán)境。這包括快速識(shí)別家具并了解佩戴者是坐在客廳、廚房還是臥室?;蛟S,蘋果正在開(kāi)發(fā)可以識(shí)別圖像和視頻的多模態(tài)大模型。

但和其他公司正在開(kāi)發(fā)的眼鏡形態(tài)相比,Vision Pro又大又重,且不適合在戶外日常場(chǎng)景中使用。

另一方面,據(jù)報(bào)道,蘋果公司今年早些時(shí)候暫停了自己的AR眼鏡的開(kāi)發(fā)工作,以專注于其頭顯的銷售。目前尚不清楚AR眼鏡的研發(fā)工作何時(shí)會(huì)恢復(fù)。

4.Meta:已適配雷朋眼鏡,提供AI新功能

Meta首席技術(shù)官Andrew Bosworth周二在Instagram發(fā)帖說(shuō),部分雷朋(Ray-Ban)眼鏡用戶將能夠直接在智能眼鏡端訪問(wèn)AI大模型。

Meta的一些領(lǐng)導(dǎo)者將雷朋眼鏡視為AR眼鏡的“先驅(qū)”。該設(shè)備可以將數(shù)字圖像與周圍現(xiàn)實(shí)世界融合在一起。按照原計(jì)劃,Meta計(jì)劃在未來(lái)幾年推出AR眼鏡,但該計(jì)劃遇到了一系列困難。具體而言,有報(bào)道稱,智能眼鏡很難吸引用戶,并且新一代顯示器開(kāi)發(fā)遇到了難題。

但多模態(tài)AI大模型的到來(lái)似乎讓Bosworth以及其團(tuán)隊(duì)重新煥發(fā)了新活力,讓他們了解這款眼鏡在短期內(nèi)可以為客戶帶來(lái)一系列AI新功能。

5.亞馬遜:開(kāi)發(fā)新AI設(shè)備系列,或?yàn)橹悄苎坨R提供支持

今年夏天,在亞馬遜每年兩次的產(chǎn)品規(guī)劃中,Alexa團(tuán)隊(duì)的工程師提出推出一款能夠運(yùn)行多模態(tài)AI的新設(shè)備

據(jù)直接了解相關(guān)項(xiàng)目的人士透露,該團(tuán)隊(duì)特別關(guān)注的是如何減少在設(shè)備上處理圖像、視頻和語(yǔ)音等AI計(jì)算和內(nèi)存的需求。目前尚不清楚該項(xiàng)目是否獲得了資金支持,也不清楚該設(shè)備打算為客戶解決什么問(wèn)題,但它與該公司的Echo語(yǔ)音助理設(shè)備系列是分開(kāi)的。

此前,Alexa團(tuán)隊(duì)也曾研發(fā)過(guò)一款名為Echo Frames的智能音頻眼鏡。該設(shè)備不支持屏幕顯示器或攝像頭。目前尚不清楚亞馬遜是否會(huì)開(kāi)發(fā)具有視覺(jué)識(shí)別功能的智能眼鏡。

6.AI可穿戴設(shè)備+攝像頭,或成大模型最佳硬件載體

這不是硅谷巨頭們第一次設(shè)計(jì)這類帶有攝像頭的可穿戴設(shè)備產(chǎn)品。此前谷歌、微軟以及其他科技巨頭都曾研發(fā)過(guò)AR頭顯。他們當(dāng)初希望能夠讓數(shù)字屏幕出現(xiàn)在頭顯的半透明屏幕上,逐步提供指引幫助用戶完成任務(wù)。但由于光學(xué)設(shè)計(jì)較復(fù)雜,最后多數(shù)產(chǎn)品反響不佳。

OpenAI推出的多模態(tài)大語(yǔ)言模型,可以通過(guò)視覺(jué)識(shí)別功能,讓AI知道人們?cè)诳词裁?,在做什么,并且可以?duì)這些行為、事物提供進(jìn)一步信息。當(dāng)大語(yǔ)言模型開(kāi)始輕量化,一些小型設(shè)備也可以搭載模型,能夠即時(shí)反饋用戶的請(qǐng)求。考慮到人們對(duì)隱私安全的重視,人們可能還需要一段時(shí)間才能接受智能眼鏡,以及一些內(nèi)置攝像頭的AI設(shè)備。

The Information覺(jué)得智能眼鏡擁有AI助手后,或許將會(huì)成為像智能手機(jī)一樣變革性的產(chǎn)品。它不但能成為指導(dǎo)學(xué)生數(shù)學(xué)問(wèn)題或者論文問(wèn)題的導(dǎo)師,還可以隨時(shí)給周邊的人提供環(huán)境信息,如翻譯廣告牌、告訴用戶如何解決汽車故障等。

蘋果公司前工程經(jīng)理,AI搜索公司Objective的首席執(zhí)行官巴勃羅·門德斯(Pablo Mendes)說(shuō):“AI大模型對(duì)一切都至關(guān)重要,它們將在計(jì)算機(jī)、手機(jī)和其他設(shè)備的底層架構(gòu)中起到作用”。

7.結(jié)語(yǔ):科技巨頭尋求AI大模型最佳硬件載體

在由ChatGPT掀起的第三輪人工智能熱潮中,多模態(tài)大模型屬于底層基礎(chǔ)設(shè)施,ChatGPT屬于直接應(yīng)用,這些都是已經(jīng)明晰的答案。但ChatGPT在哪些設(shè)備上才能最大發(fā)揮出其應(yīng)用潛力,哪些設(shè)備又是大語(yǔ)言模型的最佳載體?這些成為OpenAI、微軟、谷歌等科技巨頭們?nèi)缃耖_(kāi)始摸索的方向。

從The Information最新爆料看來(lái),帶有攝像頭的智能眼鏡成為不少巨頭探索的重要方向,同時(shí)也有部分企業(yè)開(kāi)始摸索研發(fā)新的可穿戴AI設(shè)備。又或者,嘗試在手機(jī)上適配各類AI大模型。

其實(shí)不僅是科技巨頭們?nèi)绱怂伎?。在?guó)內(nèi),不少AR眼鏡廠商們同樣也認(rèn)為這是機(jī)遇所在?!皺C(jī)器人和AR眼鏡或許將成為這波AI大模型的最大受益者?!币晃魂P(guān)注AI產(chǎn)業(yè)十余年的產(chǎn)業(yè)人士說(shuō)道。

但在同一設(shè)計(jì)思路下,最后誰(shuí)能調(diào)教出最好的輕量化AI模型?誰(shuí)又能打造出最實(shí)用的智能眼鏡?我們將持續(xù)觀察各大科技巨頭的進(jìn)展,找到答案。

來(lái)源:The Information

推薦器件

更多器件
器件型號(hào) 數(shù)量 器件廠商 器件描述 數(shù)據(jù)手冊(cè) ECAD模型 風(fēng)險(xiǎn)等級(jí) 參考價(jià)格 更多信息
SA605DK/01,112 1 NXP Semiconductors SA605 - High performance low power mixer FM IF system SSOP2 20-Pin
$5.47 查看
TFP401APZP 1 Texas Instruments 165-MHz TMDS DVI receiver/deserializer with HSYNC & Panelbus™ integrated circuit 100-HTQFP 0 to 70

ECAD模型

下載ECAD模型
$10.93 查看
TAS2505TRGERQ1 1 Texas Instruments Automotive, 2-W, mono, digital input class-D audio amp with audio processing & integ. load diagnosti 24-VQFN -40 to 105
$1.95 查看

相關(guān)推薦

電子產(chǎn)業(yè)圖譜