chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

如何開發(fā)與自定義應(yīng)用的音頻分類模

Tensorflowers ? 來源:ensorFlow ? 作者: Luiz GUStavo Martins ? 2021-10-11 10:08 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

在 Google I/O 大會上我們分享了一套教程,幫大家在音頻方面使用機器學(xué)習(xí)。在這篇文章中,您可找到一些相關(guān)資源,幫助開發(fā)與自定義應(yīng)用的音頻分類模型,以及激發(fā)靈感的真實案例。

音頻機器學(xué)習(xí)

“聲音”和“音頻“兩詞有時候會被混用,但是兩者有一點本質(zhì)上的區(qū)別,即聲音是你聽見的內(nèi)容,而音頻則是聲音的電子表現(xiàn)形式。這就是為什么我們討論機器學(xué)習(xí)的時候使用“音頻”一詞的原由。

音頻機器學(xué)習(xí)可用于:

理解語音

識別樂器

對事件分類(例如:識別鳥的種類)

檢測音高

生成音樂

本文我們將重點關(guān)注”音頻事件分類“,這是一種常見需求,在現(xiàn)實生活中的應(yīng)用非常多。例如 NOAA 創(chuàng)建了座頭鯨聲波探測器,再如倫敦動物學(xué)會使用音頻識別來保護野生動物。

座頭鯨聲波探測器

https://www.blog.google/technology/ai/pattern-radio-whale-songs/

您現(xiàn)在就可以前往 TensorFlow Hub 體驗多種音頻事件分類模型(YAMNet、鯨魚探測)。

TensorFlow Hub

https://hub.tensorflow.google.cn

YAMNet

https://hub.tensorflow.google.cn/google/yamnet/1

鯨魚探測

https://hub.tensorflow.google.cn/google/humpback_whale/1

音頻識別也完全能夠在設(shè)備端運行。例如,Android 擁有一項聲音通知功能,此功能可在您身邊出現(xiàn)重要聲音時推送通知。這項功能還可以檢測設(shè)備正在播放哪種音樂,甚至還可以通過一個基于機器學(xué)習(xí)的音頻錄制器來記錄設(shè)備上的對話。

聲音通知

https://blog.google/products/android/new-sound-notifications-on-android/

正在播放哪種音樂

https://blog.google/products/pixel/on-device-ai-with-pixel4/

音頻錄制器

https://ai.googleblog.com/2019/12/the-on-device-machine-learning-behind.html

如何在自己的應(yīng)用中使用這些模型?

如何根據(jù)自己的音頻用例自定義這些模型?

部署設(shè)備端機器學(xué)習(xí)模型

想象一下,如果您已經(jīng)擁有一個音頻分類模型(例如從 TF-Hub 獲取的預(yù)訓(xùn)練模型),您會怎樣在移動應(yīng)用上使用該模型?為了幫助您將音頻分類集成到應(yīng)用中,我們創(chuàng)建了 TensorFlow Lite Task Library。音頻分類器組件現(xiàn)已發(fā)布,您只需幾行代碼即可將音頻分類模型添加到您的應(yīng)用之中:

音頻分類器

https://tensorflow.google.cn/lite/inference_with_metadata/task_library/audio_classifier

// Initialization

val classifier = AudioClassifier.createFromFile(this, modelPath)

// Start recording

val record = classifier.createAudioRecord()

record.startRecording()

// Load latest audio samples

val tensor = classifier.createInputTensorAudio()

tensor.load(record);

// Run inference

val output = classifier.classify(tensor)

該庫負(fù)責(zé)將音頻分類模型加載到內(nèi)存,以使用適當(dāng)?shù)哪P鸵?guī)格(采樣率、比特率)和分類方法創(chuàng)建音頻錄制器,并獲取模型推理結(jié)果。您可以點擊此處查看完整示例并獲取靈感。

此處

https://github.com/tensorflow/examples/tree/master/lite/examples/sound_classification/android

自定義模型

如果您需要識別的音頻事件未包含在預(yù)訓(xùn)練模型提供的集合中,應(yīng)該怎么辦?或者您需要細化事件類別,又該如何?在以上情況下,您可以使用一項名為遷移學(xué)習(xí)的技術(shù)對模型進行微調(diào)。

遷移學(xué)習(xí)

https://developers.google.com/machine-learning/glossary#transfer-learning

這一流程十分常規(guī),您無需成為機器學(xué)習(xí)方面的專家也能做到。在此過程中,您可以使用 Model Maker 來助您一臂之力。

Model Maker

https://tensorflow.google.cn/lite/guide/model_maker

spec = audio_classifier.YamNetSpec()

data = audio_classifier.DataLoader.from_folder(spec, DATA_DIR)

train_data, validation_data = data.split(0.8)

model = audio_classifier.create(train_data, spec, validation_data)

model.export(models_path)

您可以點擊此處查看完整代碼。輸出模型可使用 Task Library 直接加載。另外,Model Maker 不僅能夠自定義音頻模型,還可以自定義圖像、文本以及推薦系統(tǒng)的模型。

此處

https://tensorflow.google.cn/lite/tutorials/model_maker_audio_classification

總結(jié)

音頻機器學(xué)習(xí)是一個令人興奮的領(lǐng)域,具備許多可能性,同時支持不少新功能。借助 TensorFlow Lite Task Library 等工具,在設(shè)備端使用機器學(xué)習(xí) 變得越來越簡單便捷。有了 Model Maker,無需領(lǐng)域?qū)I(yè)知識也可進行自定義。

您可以在我們有關(guān)設(shè)備端機器學(xué)習(xí)的新網(wǎng)站中了解詳情(點擊此處可前往音頻路徑)。您將找到教程、代碼 等相關(guān)資源,這些資源不僅包括如何處理音頻相關(guān)的任務(wù),還包括圖像(分類、目標(biāo)檢測)以及文本(分類、實體提取、問答)等。

設(shè)備端機器學(xué)習(xí)

https://developers.google.com/learn/topics/on-device-ml

此處

https://developers.google.com/learn/pathways/on-device-ml-5

您還可以在社交網(wǎng)絡(luò)帖子中添加 #TensorFlow 標(biāo)簽,與我們分享您在項目中創(chuàng)建的內(nèi)容,或者將其提交參加 TensorFlow Community Spotlight 計劃。如果有任何疑問,歡迎在 discuss.tensorflow.google.cn 上提問。

discuss.tensorflow.google.cn

https://discuss.tensorflow.google.cn/

責(zé)任編輯:haq

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 音頻
    +關(guān)注

    關(guān)注

    31

    文章

    3099

    瀏覽量

    84526
  • 機器學(xué)習(xí)
    +關(guān)注

    關(guān)注

    66

    文章

    8528

    瀏覽量

    135886

原文標(biāo)題:如何輕松部署設(shè)備端音頻機器學(xué)習(xí)?

文章出處:【微信號:tensorflowers,微信公眾號:Tensorflowers】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    如何使用SDK進行自定義音頻播放功能

    在上一篇文章安信可離線語音模組 VC-01、VC-02 系列教程 【二次開發(fā)篇】自定義音頻替換失敗過程中,簡要概述了res_build_tool.py 文件, 其主要的作用就是將音頻
    的頭像 發(fā)表于 09-25 15:52 ?2818次閱讀
    如何使用SDK進行<b class='flag-5'>自定義</b><b class='flag-5'>音頻</b>播放功能

    LOTO示波器自定義解碼功能—CANFD解碼

    LOTO示波器軟件更新了自定義解碼功能,并在bilibili上傳了演示視頻,視頻鏈接: https://www.bilibili.com/video/BV1wq3ezjEjQ
    的頭像 發(fā)表于 07-11 10:34 ?513次閱讀
    LOTO示波器<b class='flag-5'>自定義</b>解碼功能—CANFD解碼

    大彩講堂:VisualTFT軟件如何自定義圓形進度條

    VisualTFT軟件如何自定義圓形進度條
    的頭像 發(fā)表于 07-07 17:10 ?956次閱讀
    大彩講堂:VisualTFT軟件如何<b class='flag-5'>自定義</b>圓形進度條

    KiCad 中的自定義規(guī)則(KiCon 演講)

    “ ?Seth Hillbrand 在 KiCon US 2025 上為大家介紹了 KiCad 的規(guī)則系統(tǒng),并詳細講解了自定義規(guī)則的設(shè)計與實例。? ” ? 演講主要圍繞 加強 KiCad 中的自定義
    的頭像 發(fā)表于 06-16 11:17 ?1104次閱讀
    KiCad 中的<b class='flag-5'>自定義</b>規(guī)則(KiCon 演講)

    HarmonyOS應(yīng)用自定義鍵盤解決方案

    自定義鍵盤是一種替換系統(tǒng)默認(rèn)鍵盤的解決方案,可實現(xiàn)鍵盤個性化交互。允許用戶結(jié)合業(yè)務(wù)需求與操作習(xí)慣,對按鍵布局進行可視化重構(gòu)、設(shè)置多功能組合鍵位,使輸入更加便捷和舒適。在安全防護層面,自定義鍵盤可以
    的頭像 發(fā)表于 06-05 14:19 ?1240次閱讀

    如何使用自定義設(shè)置回調(diào)函數(shù)?

    你好,我正在嘗試編寫自己的自定義設(shè)置回調(diào)函數(shù),并使用 fastEnum=false。 是否有任何代碼示例或資料可供我參考? void CyU3PUsbRegisterSetupCallback
    發(fā)表于 05-21 06:11

    LabVIEW運動控制(三):EtherCAT運動控制器的高效加工指令自定義封裝

    LabVIEW高效加工指令自定義封裝
    的頭像 發(fā)表于 04-08 13:49 ?3071次閱讀
    LabVIEW運動控制(三):EtherCAT運動控制器的高效加工指令<b class='flag-5'>自定義</b>封裝

    如何添加自定義單板

    開發(fā)過程中,用戶有時需要創(chuàng)建自定義板配置。本節(jié)將通過一個實例講解用戶如何創(chuàng)建屬于自己的machine,下面以g2l-test.conf為例進行說明。
    的頭像 發(fā)表于 03-12 14:43 ?868次閱讀

    如何快速創(chuàng)建用戶自定義Board和App工程

    可將該文件夾復(fù)制到用戶自定義的工作目錄(workspace)中,基于此模板進行開發(fā)。本模板主要牽涉到的用戶自定義的文件有:用戶板級文件Board用戶應(yīng)用程序App用
    的頭像 發(fā)表于 02-08 13:38 ?817次閱讀
    如何快速創(chuàng)建用戶<b class='flag-5'>自定義</b>Board和App工程

    KiCad 9 探秘(六):如何用&quot;器件類&quot;玩轉(zhuǎn)多通道設(shè)計與自定義DRC規(guī)則

    “ ?老版本的 KiCad 只有網(wǎng)絡(luò)類(Net Class),但沒有器件類(Component Class),在 KiCad 9 中器件類終于亮相了。結(jié)合規(guī)則區(qū)域,器件類可以在多通道設(shè)計及自定義規(guī)則
    的頭像 發(fā)表于 02-08 11:14 ?2072次閱讀
    KiCad 9 探秘(六):如何用&quot;器件類&quot;玩轉(zhuǎn)多通道設(shè)計與<b class='flag-5'>自定義</b>DRC規(guī)則

    Altium Designer 15.0自定義元件設(shè)計

    電子發(fā)燒友網(wǎng)站提供《Altium Designer 15.0自定義元件設(shè)計.pdf》資料免費下載
    發(fā)表于 01-21 15:04 ?0次下載
    Altium Designer 15.0<b class='flag-5'>自定義</b>元件設(shè)計

    think-cell:自定義think-cell(四)

    C.5 設(shè)置默認(rèn)議程幻燈片布局 think-cell 議程可以在演示文稿中使用特定的自定義布局來定義議程、位置和議程幻燈片上的其他形狀,例如標(biāo)題或圖片。通過將此自定義布局添加到模板,您可以為整個組織
    的頭像 發(fā)表于 01-13 10:37 ?782次閱讀
    think-cell:<b class='flag-5'>自定義</b>think-cell(四)

    智能語音識別照明解決方案,平臺自定義,中英切換

    智能語音識別照明方案引入NRK3502芯片,支持平臺自定義,離線控制,中英雙語切換。NRK3502具備高性能和靈活自定義能力,可推動智能照明革新,控制其他智能設(shè)備,為國際用戶提供全方位智能生活體驗。
    的頭像 發(fā)表于 01-10 13:23 ?673次閱讀
    智能語音識別照明解決方案,平臺<b class='flag-5'>自定義</b>,中英切換

    think-cell;自定義think-cell(一)

    本章介紹如何自定義 think-cell,即如何更改默認(rèn)顏色和其他默認(rèn)屬性;這是通過 think-cell 的樣式文件完成的,這些文件將在前四個部分中進行討論。 第五部分 C.5 設(shè)置默認(rèn)議程幻燈片
    的頭像 發(fā)表于 01-08 11:31 ?1131次閱讀
    think-cell;<b class='flag-5'>自定義</b>think-cell(一)

    TPS659xx應(yīng)用程序自定義工具

    電子發(fā)燒友網(wǎng)站提供《TPS659xx應(yīng)用程序自定義工具.pdf》資料免費下載
    發(fā)表于 11-06 10:02 ?0次下載
    TPS659xx應(yīng)用程序<b class='flag-5'>自定義</b>工具