加入星計(jì)劃,您可以享受以下權(quán)益:

  • 創(chuàng)作內(nèi)容快速變現(xiàn)
  • 行業(yè)影響力擴(kuò)散
  • 作品版權(quán)保護(hù)
  • 300W+ 專業(yè)用戶
  • 1.5W+ 優(yōu)質(zhì)創(chuàng)作者
  • 5000+ 長(zhǎng)期合作伙伴
立即加入

具有語(yǔ)音功能的機(jī)器,可閱讀書籍并回答問題

2020/09/24
494
服務(wù)支持:
技術(shù)交流群

完成交易后在“購(gòu)買成功”頁(yè)面掃碼入群,即可與技術(shù)大咖們分享疑惑和經(jīng)驗(yàn)、收獲成長(zhǎng)和認(rèn)同、領(lǐng)取優(yōu)惠和紅包等。

虛擬商品不可退

當(dāng)前內(nèi)容為數(shù)字版權(quán)作品,購(gòu)買后不支持退換且無(wú)法轉(zhuǎn)移使用。

加入交流群
掃碼加入
獲取工程師必備禮包
參與熱點(diǎn)資訊討論
放大
方塊圖(2)
相關(guān)方案
  • 方案介紹
  • 相關(guān)文件
  • 相關(guān)推薦
  • 電子產(chǎn)業(yè)圖譜
申請(qǐng)入駐 產(chǎn)業(yè)圖譜

在這個(gè)項(xiàng)目中,我構(gòu)建了啟用語(yǔ)音的可教機(jī)器,該機(jī)器可以掃描書頁(yè)或任何文本源中的文本并將其轉(zhuǎn)換為上下文,用戶可以提出與該上下文有關(guān)的問題,并且該機(jī)器可以僅使用上下文進(jìn)行回答。我一直想制造一種易于部署且可以輕松針對(duì)給定上下文進(jìn)行培訓(xùn)而無(wú)需任何互聯(lián)網(wǎng)連接的邊緣設(shè)備。

硬件部件:

軟件應(yīng)用程序和在線服務(wù):

  • 樹莓派Raspbian
  • 英特爾OpenVINO工具包
  • Tesseract OCR
  • 深度語(yǔ)音

應(yīng)用程序中使用的機(jī)器學(xué)習(xí)模型

使用了三種機(jī)器學(xué)習(xí)模型:

1. Tesseract OCR(基于LSTM的模型)

Tesseract是一種OCR引擎,支持unicode,并具有開箱即用地識(shí)別100多種語(yǔ)言的能力??梢杂?xùn)練它識(shí)別其他語(yǔ)言。

2. DeepSpeech(TensorFlow Lite型號(hào))

DeepSpeech是一個(gè)開源的語(yǔ)音轉(zhuǎn)文本引擎,使用由機(jī)器學(xué)習(xí)技術(shù)訓(xùn)練的模型,該模型由Google的TensorFlow簡(jiǎn)化實(shí)施。

3. BERT

BERT是一種語(yǔ)言表示模型,代表變壓器的雙向編碼器表示。預(yù)訓(xùn)練的BERT模型僅需增加一個(gè)輸出層即可進(jìn)行微調(diào),以創(chuàng)建適用于各種任務(wù)(例如問題解答和語(yǔ)言推論)的最新模型,而無(wú)需進(jìn)行大量針對(duì)特定任務(wù)的體系結(jié)構(gòu)修改。

前兩個(gè)模型在Raspberry Pi 4上運(yùn)行,最后一個(gè)模型在使用OpenVINO Toolkit的Intel Neural Compute Stick 2上運(yùn)行。

  • techable_machine_trJoUnilFN.jpg
    描述:原理圖截圖
  • TeachableMachine-master.zip
    描述:源碼
  • 項(xiàng)目詳情.pdf
    描述:項(xiàng)目細(xì)節(jié)
英特爾

英特爾

英特爾在云計(jì)算、數(shù)據(jù)中心、物聯(lián)網(wǎng)和電腦解決方案方面的創(chuàng)新,為我們所生活的智能互連的數(shù)字世界提供支持。

英特爾在云計(jì)算、數(shù)據(jù)中心、物聯(lián)網(wǎng)和電腦解決方案方面的創(chuàng)新,為我們所生活的智能互連的數(shù)字世界提供支持。收起

查看更多

相關(guān)推薦

電子產(chǎn)業(yè)圖譜