資料介紹
描述
2020 年 6 月更新:DeepSpeech 0.7.* .Screenshots 的更新命令,除了 Raspberry Pi 4 保持不變。直到最近的問題是缺乏用于該任務(wù)的簡單、快速和準(zhǔn)確的引擎。大約一年前,當(dāng)我研究這個主題時,當(dāng)你必須在樹莓派 3 上運行 ASR(不僅僅是熱詞檢測,還有大詞匯量轉(zhuǎn)錄)時,有幾個選擇是:
- CMUS獅身人面像
- 卡爾迪
- 碧玉
鏈接:
還有其他幾個。它們都不容易設(shè)置,也不特別適合在資源受限的環(huán)境中運行。因此,幾周前,我再次開始研究這個領(lǐng)域,并在一些搜索中偶然發(fā)現(xiàn)了 Mozilla 的 DeepSpeech 引擎。它已經(jīng)存在了一段時間,但直到最近(2019 年 12 月)他們才發(fā)布了 0.6.0 版本的 ASR 引擎,其中包含 .tflite 模型以及其他重大改進(jìn)。它已將英文模型的大小從 188 MB 減少到 47 MB??。“帶有 TensorFlow Lite 的 DeepSpeech v0.6 在 Raspberry Pi 4 的單核上運行速度比實時速度更快?!盡ozilla 的 Reuben Morais 在新聞公告中聲稱. 所以我決定親自驗證這一說法,在不同的硬件上運行一些基準(zhǔn)測試,并制作我自己的帶有熱詞檢測的音頻轉(zhuǎn)錄應(yīng)用程序。讓我們看看結(jié)果如何。
提示:我沒有失望。

。
?
curl -LO https://github.com/mozilla/STT/releases/download/v0.7.1/deepspeech-0.7.1-models.tflite
curl -LO https://github.com/mozilla/STT/releases/download/v0.7.1/deepspeech-0.7.1-models.pbmm
curl -LO https://github.com/mozilla/STT/releases/download/v0.7.1/deepspeech-0.7.1-models.scorer
下載示例音頻文件
curl -LO https://github.com/mozilla/STT/releases/download/v0.7.1/audio-0.7.1.tar.gz
tar xvf audio-0.7.1.tar.gz
樹莓派 4 運行:
deepspeech --model deepspeech-0.7.*-models.tflite --scorer deepspeech-0.7.*-models.scorer --audio audio/2830-3980-0043.wav
如果成功,您應(yīng)該看到以下輸出

不錯!1.975 秒的聲音文件為 1.529 秒。它比實時更快。
Nvidia Jetson Nano 運行:
deepspeech --model deepspeech-0.7.*-models.tflite --scorer deepspeech-0.7.*-models.scorer --audio audio/2830-3980-0043.wav

嗯..比樹莓派慢一點。這是意料之中的,因為 Nvidia Jetson CPU 不如 Raspberry Pi 4 強大。到目前為止,還沒有用于 arm64 架構(gòu)的預(yù)構(gòu)建二進(jìn)制文件支持 GPU,因此我們無法利用 Nvidia Jetson Nano 的 GPU 進(jìn)行推理加速。我認(rèn)為這個任務(wù)不在 DeepSpeech 團(tuán)隊的路線圖上,所以在不久的將來我會在這里自己做一些研究,并嘗試編譯該二進(jìn)制文件,看看使用 GPU 可以實現(xiàn)哪些速度提升。但幾秒鐘的速度仍然相當(dāng)不錯,根據(jù)您的項目,您可能希望選擇在 CPU 上運行 DeepSpeech 并讓 GPU 用于其他深度學(xué)習(xí)任務(wù)。
視窗 10/Linux
deepspeech --model deepspeech-0.7.*-models.tflite --scorer deepspeech-0.7.*-models.scorer --audio audio/2830-3980-0043.wav


或者如果使用啟用 GPU 的版本:
deepspeech --model deepspeech-0.7.*-models.pbmm --scorer deepspeech-0.7.*-models.scorer --audio audio/2830-3980-0043.wav

如您所見,.tflite 模型在現(xiàn)代 CPU 系統(tǒng)上實現(xiàn)了亞實時,這對于創(chuàng)建離線 ASR 應(yīng)用程序的人們來說是個好消息。
以下是對比結(jié)果表:

好吧,我們對預(yù)先錄制的聲音樣本進(jìn)行了基準(zhǔn)測試,但我們真的想做一些實時轉(zhuǎn)錄。讓我們這樣做吧!
從https://github.com/mozilla/DeepSpeech-examples下載 DeepSpeech 示例
導(dǎo)航到 mic_vad_streaming 并安裝依賴項
pip3 install -r requirements.txt
sudo apt install portaudio19-dev
將麥克風(fēng)連接到您的系統(tǒng)(我使用的是 Raspberry Pi 4 1 GB)。對于麥克風(fēng),盡管您可以使用任何麥克風(fēng),包括筆記本電腦的內(nèi)置麥克風(fēng),但聲音的質(zhì)量確實對結(jié)果有很大影響。對于這個演示,我使用的是 Seeed Studio 的ReSpeaker USB 麥克風(fēng)陣列。它支持 5m 遠(yuǎn)場拾音和 360° 拾音模式,并實現(xiàn)以下聲學(xué)算法:DOA(到達(dá)方向)、AEC(自動回聲消除)、AGC(自動增益控制)、NS (噪音抑制)。

python3 ../DeepSpeech-examples/mic_vad_streaming/mic_vad_streaming.py --model deepspeech-0.7.*-models.tflite --scorer deepspeech-0.7.*-models.scorer
從包含模型的文件夾中執(zhí)行此命令。-v 參數(shù)允許您調(diào)整 VAD(語音活動檢測)的閾值。這是演示的結(jié)果。
好,太棒了!我們可以改進(jìn)嗎?是的。我們真的不希望我們的設(shè)備一直在轉(zhuǎn)錄對話。談?wù)撾[私噩夢和浪費電力。

。
- Raspberry Pi支持電視上的視頻通話
- 使用Google Coral和Raspberry Pi進(jìn)行ML鳥類識別
- Raspberry Pi 4B+ IoT板上的并行計算變得簡單
- Raspberry Pi Pico上的ADC采樣和FFT
- 使用Bittle和Raspberry Pi 4的ROS SLAM
- 用Raspberry Pi的視覺識別事物
- 帶Raspberry PI的紅外遙控器
- 使用Raspberry Pi 4和RFID模塊的考勤系統(tǒng)
- Raspberry Pi 0 W帶溫度傳感器和LCD
- Raspberry Pi和Arduino上的手寫數(shù)字識別
- 適用于Raspberry Pi 4的Raspberry Pi Pico開發(fā)板
- NRK330X語音識別芯片離線語音喚醒模塊資料說明書!
- 樹莓派Raspberry Pi 4 Model B的電路原理圖免費下載 427次下載
- 《愛上Raspberry Pi》中譯版-電子書籍.pdf 0次下載
- raspberry_pi各版本差別 0次下載
- 影響離線語音識別靈敏度的因素 565次閱讀
- 離線語音控制技術(shù)特點 539次閱讀
- 基于Raspberry Pi 5的蜂窩物聯(lián)網(wǎng)項目 1312次閱讀
- 使用Raspberry Pi Pico W和MicroPython開發(fā)物聯(lián)網(wǎng)應(yīng)用 2180次閱讀
- 用于測試項目的4個最佳樹莓派Raspberry Pi模擬器 6823次閱讀
- 基于樹莓派產(chǎn)品 Raspberry Pi微控制器板的優(yōu)缺點 2984次閱讀
- 如何從Raspberry Pi Pico的模數(shù)轉(zhuǎn)換器捕獲數(shù)據(jù)計算? 2772次閱讀
- 基于Raspberry Pi Pico開發(fā)先進(jìn)的家庭自動化系統(tǒng) 3004次閱讀
- 基于在Raspberry Pi Zero W的基礎(chǔ)上實現(xiàn)設(shè)計微型機(jī)器人 2251次閱讀
- 微雪電子ZeroW| Raspberry Pi ZeroW主板簡介 2618次閱讀
- 微雪電子Raspberry Pi 3 Model主板簡介 3145次閱讀
- 微雪電子Raspberry Pi 3 Model擴(kuò)展板簡介 1667次閱讀
- 微雪電子樹莓派4代B|Raspberry Pi主板介紹 6488次閱讀
- 利用Raspberry Pi構(gòu)建存儲和虛擬化時間序列數(shù)據(jù) 952次閱讀
- 一文了解Raspberry Pi 4各項性能跑分 3w次閱讀
下載排行
本周
- 1人工智能+消費:技術(shù)賦能與芯片驅(qū)動未來
- 15.25 MB | 4次下載 | 免費
- 2?業(yè)電源&模塊電源產(chǎn)品?冊
- 15.40 MB | 1次下載 | 免費
- 379M15 TO-252三端穩(wěn)壓IC規(guī)格書
- 0.86 MB | 次下載 | 免費
- 4MBRD20150CT TO-252肖特基二極管規(guī)格書
- 0.54 MB | 次下載 | 免費
- 5自動鎖螺絲運動控制系統(tǒng)用戶手冊
- 6.65 MB | 次下載 | 5 積分
- 6奧特光耦產(chǎn)品手冊
- 4.83 MB | 次下載 | 免費
- 7SMA系列10MHz~40GHz同軸檢波器
- 559.60 KB | 次下載 | 免費
- 8CD7388CZ:7W×4 四通道音頻功率放大電路技術(shù)手冊
- 0.39 MB | 次下載 | 10 積分
本月
- 1元宇宙深度解析—未來的未來-風(fēng)口還是泡沫
- 6.40 MB | 241次下載 | 免費
- 2元宇宙底層硬件系列報告
- 13.42 MB | 184次下載 | 免費
- 32022 年展望報告 – 半導(dǎo)體產(chǎn)業(yè)
- 1.43 MB | 136次下載 | 免費
- 4晶振與濾波器應(yīng)用電路《電子工程師必備:元器件應(yīng)用寶典》
- 1.57 MB | 90次下載 | 免費
- 5汽車電子行業(yè)深度解析:智能化與電動化方興未艾
- 6.47 MB | 71次下載 | 免費
- 6中國DPU行業(yè)白皮書
- 23.80 MB | 37次下載 | 免費
- 7晶科鑫代理線-微盟電子2021年度產(chǎn)品目錄選型手冊
- 14.75 MB | 27次下載 | 免費
- 8SJK晶振產(chǎn)品目錄-簡化版-2022
- 13.77 MB | 20次下載 | 免費
總榜
- 1matlab軟件下載入口
- 未知 | 935134次下載 | 10 積分
- 2開源硬件-PMP21529.1-4 開關(guān)降壓/升壓雙向直流/直流轉(zhuǎn)換器 PCB layout 設(shè)計
- 1.48MB | 420064次下載 | 10 積分
- 3Altium DXP2002下載入口
- 未知 | 233089次下載 | 10 積分
- 4電路仿真軟件multisim 10.0免費下載
- 340992 | 191425次下載 | 10 積分
- 5十天學(xué)會AVR單片機(jī)與C語言視頻教程 下載
- 158M | 183352次下載 | 10 積分
- 6labview8.5下載
- 未知 | 81602次下載 | 10 積分
- 7Keil工具M(jìn)DK-Arm免費下載
- 0.02 MB | 73822次下載 | 10 積分
- 8LabVIEW 8.6下載
- 未知 | 65991次下載 | 10 積分
電子發(fā)燒友App






創(chuàng)作
發(fā)文章
發(fā)帖
提問
發(fā)資料
發(fā)視頻
上傳資料賺積分
評論