chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

用NVIDIA NeMo生成高質(zhì)量的語音識別標(biāo)簽

星星科技指導(dǎo)員 ? 來源:NVIDIA ? 作者:NVIDIA ? 2022-04-27 09:15 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

使用 NVIDIA NeMo 和 標(biāo)簽工作室 中的自動語音識別( ASR )模型處理音頻數(shù)據(jù)時,可以節(jié)省時間并產(chǎn)生更準(zhǔn)確的結(jié)果。

NVIDIA NeMo 提供了可重用的神經(jīng)模塊,使得創(chuàng)建新的神經(jīng)網(wǎng)絡(luò)架構(gòu)變得容易,包括 ASR 的預(yù)構(gòu)建模塊和現(xiàn)成模型。借助 NVIDIA NeMo 的強(qiáng)大功能,您可以從預(yù)訓(xùn)練語音識別模型中獲得音頻轉(zhuǎn)錄。添加 labelstudio 及其開源數(shù)據(jù)標(biāo)記功能,您可以進(jìn)一步提高轉(zhuǎn)錄質(zhì)量。

解決方案

poYBAGJomUSASBfSAAAy2POsRYU582.jpg

圖 1 使用 Label Studio 和 NeMo 注釋和更正轉(zhuǎn)錄本的 ASR 工作流。

按照本文中的步驟使用 Label Studio 設(shè)置 NVIDIA NeMo ASR ,以生成高質(zhì)量的音頻轉(zhuǎn)錄本。

連接 NVIDIA NeMo 模型,在 Label Studio 中自動轉(zhuǎn)錄音頻文件。

設(shè)置音頻轉(zhuǎn)錄項(xiàng)目。

從 Label Studio 驗(yàn)證和導(dǎo)出修訂的音頻轉(zhuǎn)錄本。

微調(diào) NeMo ASR 模型與修改后的音頻轉(zhuǎn)錄從標(biāo)簽工作室。

先決條件

開始之前,請確保您擁有以下資源:

音頻數(shù)據(jù)文件。 此音頻 MIG 可以是客戶服務(wù)電話、電話訂單、銷售對話的錄音,也可以是其他與人交談的錄音。音頻文件必須采用以下文件格式之一:

WAV

AIFF

MP3

AU

FLAC

已安裝 Label Studio 。 在本地計算機(jī)或云服務(wù)器上使用首選方法安裝 Label Studio 。有關(guān)更多信息,請參閱 Label Studio 文檔中的 Quickstart 。

NeMo 工具箱已安裝

免費(fèi)音頻數(shù)據(jù)

如果您沒有任何音頻數(shù)據(jù),可以使用示例數(shù)據(jù)集或歷史音頻數(shù)據(jù)集:

LJ 語音數(shù)據(jù)集 是非小說類書籍段落的公共域數(shù)據(jù)集。

Librispeech 還提供了一個 基于開放 SLR 的開源 ASR 語料庫 。

您可以使用許多其他 ASR 數(shù)據(jù)集。有關(guān)詳細(xì)信息,請參閱 數(shù)據(jù)集 – 簡介 。您還可以使用國會圖書館網(wǎng)站上的公共域錄音集,如 美國棒球運(yùn)動員訪談錄 。

確定要轉(zhuǎn)錄的音頻后,就可以開始處理它了。

安裝 Label Studio ML 后端

安裝 Label Studio 后,請安裝 Label Studio 機(jī)器學(xué)習(xí)后端。從命令行運(yùn)行以下命令:

git clone https://github.com/heartexlabs/label-studio-ml-backend 

設(shè)置環(huán)境:

cd label-studio-ml-backend

# Install label-studio-ml and its dependencies
pip install -U -e .

# Install the nemo example dependencies
pip install -r label_studio_ml/examples/requirements.txt

連接 NVIDIA NeMo 模型,在 Label Studio 中自動轉(zhuǎn)錄音頻文件

要使用預(yù)先訓(xùn)練的 ASR 模型的預(yù)測對數(shù)據(jù)進(jìn)行預(yù)標(biāo)記,請在 Label Studio 中將 NeMo 工具箱設(shè)置為機(jī)器學(xué)習(xí)后端。 Label Studio 機(jī)器學(xué)習(xí)后端允許您使用預(yù)先訓(xùn)練的模型來預(yù)標(biāo)記數(shù)據(jù)。

Label Studio 包括使用 利用 NGC 云中的 NeMo 開發(fā)的預(yù)訓(xùn)練 QuartzNet15x5 模型 的 一個例子 ,但是如果另一個模型更適合,您可以用您的數(shù)據(jù)設(shè)置一個不同的模型。有關(guān)更多信息,請參閱 NeMo 提供的 ASR 型號列表 。

在命令行中,將 NeMo 設(shè)置為機(jī)器學(xué)習(xí)后端,并使用該模型啟動一個新的 Label Studio 項(xiàng)目。

安裝 NeMo 工具箱 在 Docker 容器中或使用 pip 。

下載 NeMo ASR 模型。提供的 Label Studio 示例腳本從 NGC 云下載預(yù)先訓(xùn)練的 QuartzNet 模型。要使用不同的模型,請從 NGC 下載該模型。

從命令行啟動 Label Studio 機(jī)器學(xué)習(xí)后端。

label-studio-ml init my_model --from label_studio_ml/examples/nemo/asr.py

啟動機(jī)器學(xué)習(xí)后端。默認(rèn)情況下,模型在本地主機(jī)上以端口 9090 啟動。

label-studio-ml start my_model

用模型啟動 Label Studio 。

label-studio start my_project --ml-backends http://localhost:9090

設(shè)置音頻轉(zhuǎn)錄項(xiàng)目

啟動 Label Studio 后,導(dǎo)入音頻數(shù)據(jù)并設(shè)置正確的模板來配置標(biāo)簽。 VZX19 是自動語音識別的最佳選擇,它使音頻數(shù)據(jù)的注釋變得容易。

打開 Label Studio ,導(dǎo)入數(shù)據(jù),然后選擇模板。

選擇 Import 并以純文本或 JSON 文件的形式導(dǎo)入音頻數(shù)據(jù),這些文件引用在線存儲(如 Amazon S3 )中托管的音頻文件的有效 url 。

2 從 Tasks 列表中,選擇 Settings 。

3 在 標(biāo)簽界面 選項(xiàng)卡上,瀏覽模板并選擇 自動語音識別 模板。

4 選擇 Save 。

驗(yàn)證并輸出模型預(yù)測

作為注釋器,檢查任務(wù)界面上音頻數(shù)據(jù)的任務(wù)并驗(yàn)證。如有必要,糾正 NeMo 語音模型預(yù)測的轉(zhuǎn)錄本。

從 Label Studio 中的任務(wù)列表中,選擇 Label 。

對于每個音頻樣本,聆聽音頻并回顧 NeMo 模型產(chǎn)生的轉(zhuǎn)錄,作為預(yù)標(biāo)記過程的一部分。

如果成績單中有任何單詞不正確,請更新。

保存對成績單的更改。選擇 Submit 提交成績單并查看下一個音頻樣本。

接下來,按照 NVIDIA NVIDIA 文檔中的 NeMo ASR 集合 所述,以 NeMo 模型所期望的正確格式從 Label Studio 導(dǎo)出完成的音頻轉(zhuǎn)錄本。

要導(dǎo)出完成的音頻,請執(zhí)行以下操作:

從 Label Studio 中的任務(wù)列表中,選擇 Export 。

選擇名為 ASR_MANIFEST 的音頻轉(zhuǎn)錄 JSON 格式。

有關(guān) Label Studio 中可用導(dǎo)出格式的詳細(xì)信息,請參閱 從 Label Studio 導(dǎo)出結(jié)果 。

使用高質(zhì)量的成績單來微調(diào)您的 ML 模型

當(dāng)您處理完音頻并調(diào)整完轉(zhuǎn)錄的文本后,剩下的是音頻轉(zhuǎn)錄本,您可以用來重新培訓(xùn) NeMo 中包含的 ASR 模型。 Label Studio 生成與 NeMo 培訓(xùn)完全兼容的注釋。

要更新 QuartzNet 模型檢查點(diǎn),您可以在幾行代碼中完成,從頭開始訓(xùn)練模型,或者使用 PyTorch Lightning 。例子也可以在 NeMo Jupyter 筆記本中找到。

通過同時使用 Label Studio 和 NeMo ,您可以節(jié)省從頭開始處理每個音頻文件的時間 NeMo 可以立即為您提供高度準(zhǔn)確的預(yù)測,而 Label Studio 可以幫助您實(shí)現(xiàn)完美的預(yù)測 今天就試試 !

關(guān)于作者

Nikolai Liubimov是Heartex的CTO。 完成博士學(xué)位后 他在CS擔(dān)任機(jī)器學(xué)習(xí)研究員,后來進(jìn)入該行業(yè),并花了10年的時間將深度學(xué)習(xí)技術(shù)應(yīng)用于現(xiàn)實(shí)世界中的問題。 這項(xiàng)經(jīng)驗(yàn)為當(dāng)前缺少哪些工具提供了寶貴的見解,從而創(chuàng)建了一家初創(chuàng)公司來幫助數(shù)據(jù)科學(xué)和機(jī)器學(xué)習(xí)工程團(tuán)隊構(gòu)建和改進(jìn)其ML模型。

Sarah Moir是Heartex的產(chǎn)品內(nèi)容和教育主管,為Heartex的數(shù)據(jù)注釋和標(biāo)簽解決方案撰寫文檔,博客文章和教育教程。 薩拉(Sarah)在過去的八年中一直是數(shù)據(jù)和安全領(lǐng)域的技術(shù)作家,并且對數(shù)據(jù)分析,機(jī)器學(xué)習(xí)和編寫充滿熱情。

審核編輯:郭婷

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • NVIDIA
    +關(guān)注

    關(guān)注

    14

    文章

    5309

    瀏覽量

    106412
  • 計算機(jī)
    +關(guān)注

    關(guān)注

    19

    文章

    7663

    瀏覽量

    90805
  • 服務(wù)器
    +關(guān)注

    關(guān)注

    13

    文章

    9795

    瀏覽量

    87993
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點(diǎn)推薦

    新能源變革之路,要建在“高質(zhì)量”的路基上

    高質(zhì)量”是能源革命的前提與基座
    的頭像 發(fā)表于 06-24 11:42 ?1715次閱讀
    新能源變革之路,要建在“<b class='flag-5'>高質(zhì)量</b>”的路基上

    淺析:數(shù)字經(jīng)濟(jì)時代,高質(zhì)量數(shù)據(jù)集對AI產(chǎn)業(yè)帶來哪些新的變化

    大模型技術(shù)不斷取得突破,其中大規(guī)模高質(zhì)量訓(xùn)練數(shù)據(jù)的投入,起到了關(guān)鍵作用,也進(jìn)一步將?“以數(shù)據(jù)為中心的人工智能”?推向一個新階段。從早期簡單的圖像識別、語音識別,到如今復(fù)雜的自然語言處理
    的頭像 發(fā)表于 05-09 15:10 ?287次閱讀

    企業(yè)使用NVIDIA NeMo微服務(wù)構(gòu)建AI智能體平臺

    已發(fā)布的 NeMo 微服務(wù)可與合作伙伴平臺集成,作為創(chuàng)建 AI 智能體的構(gòu)建模塊,使用商業(yè)智能與強(qiáng)大的邏輯推理模型 (包括 NVIDIA Llama Nemotron) 處理更多任務(wù)。
    的頭像 發(fā)表于 04-27 15:05 ?536次閱讀

    電動工具EMC測試整改:邁向高質(zhì)量生產(chǎn)的必由之路

    深圳南柯電子|電動工具EMC測試整改:邁向高質(zhì)量生產(chǎn)的必由之路
    的頭像 發(fā)表于 02-27 09:37 ?401次閱讀
    電動工具EMC測試整改:邁向<b class='flag-5'>高質(zhì)量</b>生產(chǎn)的必由之路

    廣汽集團(tuán)召開高質(zhì)量發(fā)展大會

    春回大地,萬象更新。近兩日廣東省、廣州市聚焦“建設(shè)現(xiàn)代化產(chǎn)業(yè)體系”主題,相繼召開“新春第一會”——高質(zhì)量發(fā)展大會,吹響奮進(jìn)號角。廣汽集團(tuán)黨委書記、董事長馮興亞作為省市重點(diǎn)產(chǎn)業(yè)高質(zhì)量發(fā)展代表參加會議,與產(chǎn)學(xué)研各界代表共聚一堂,共繪廣東、廣州
    的頭像 發(fā)表于 02-07 10:18 ?602次閱讀

    NVIDIA NeMo Guardrails引入三項(xiàng)全新NIM微服務(wù)

    NVIDIA NeMo Guardrails 包含全新 NVIDIA NIM 微服務(wù),能夠?yàn)楦餍袠I(yè)構(gòu)建 AI 的企業(yè)提高 AI 的準(zhǔn)確性、安全性和可控性。
    的頭像 發(fā)表于 01-18 09:39 ?715次閱讀

    電動工具EMC測試整改:邁向高質(zhì)量生產(chǎn)的必經(jīng)之路

    深圳南柯電子|電動工具EMC測試整改:邁向高質(zhì)量生產(chǎn)的必經(jīng)之路
    的頭像 發(fā)表于 01-14 14:29 ?518次閱讀
    電動工具EMC測試整改:邁向<b class='flag-5'>高質(zhì)量</b>生產(chǎn)的必經(jīng)之路

    借助谷歌Gemini和Imagen模型生成高質(zhì)量圖像

    在快速發(fā)展的生成式 AI 領(lǐng)域,結(jié)合不同模型的優(yōu)勢可以帶來顯著的成果。通過利用谷歌的 Gemini 模型來制作詳細(xì)且富有創(chuàng)意的提示,然后使用 Imagen 3 模型根據(jù)這些提示生成高質(zhì)量的圖像,您可
    的頭像 發(fā)表于 01-03 10:38 ?899次閱讀
    借助谷歌Gemini和Imagen模型<b class='flag-5'>生成</b><b class='flag-5'>高質(zhì)量</b>圖像

    芯導(dǎo)科技榮獲上市公司高質(zhì)量發(fā)展大會“科技創(chuàng)新獎”

    ? 近日,由上海證券報與中國證券網(wǎng)主辦的“上證·滴水湖上市公司高質(zhì)量發(fā)展大會”暨“上證·金質(zhì)量”頒獎儀式在上海圓滿舉辦。 ? “上證 ·?金質(zhì)量”獎是國內(nèi)上市公司領(lǐng)域內(nèi)最權(quán)威、最具影響力的獎項(xiàng)之一
    的頭像 發(fā)表于 12-28 16:26 ?779次閱讀

    江蘇多維科技皮特級TMR芯片成功檢測到高質(zhì)量的成人實(shí)時心磁信號

    江蘇多維科技皮特級TMR芯片成功檢測到高質(zhì)量的成人實(shí)時心磁信號
    的頭像 發(fā)表于 12-16 16:07 ?515次閱讀
    江蘇多維科技皮特級TMR芯片成功檢測到<b class='flag-5'>高質(zhì)量</b>的成人實(shí)時心磁信號

    立洋光電助力城市照明高質(zhì)量發(fā)展

    為促進(jìn)湖南省照明行業(yè)向高端化、智能化、綠色化產(chǎn)業(yè)升級,湖南省城鄉(xiāng)建設(shè)行業(yè)協(xié)會照明分會在長沙隆重舉行了2023年湖南省照明行業(yè)年會暨“創(chuàng)新驅(qū)動、以新質(zhì)生產(chǎn)力賦能城市照明高質(zhì)量發(fā)展”技術(shù)交流活動。
    的頭像 發(fā)表于 10-22 10:49 ?724次閱讀

    中興通訊引領(lǐng)5G-A高質(zhì)量發(fā)展新紀(jì)元

    中國5G商用5周年之際,以“智聯(lián)未來 無限可能”為主題的2024移動通信高質(zhì)量發(fā)展論壇在北京舉辦。本屆論壇系統(tǒng)呈現(xiàn)總結(jié)我國移動通信,特別是5G產(chǎn)業(yè)自身高質(zhì)量發(fā)展和引領(lǐng)數(shù)字經(jīng)濟(jì)高質(zhì)量發(fā)展的成果和經(jīng)驗(yàn),展望5G-A、6G協(xié)同創(chuàng)新發(fā)展
    的頭像 發(fā)表于 10-15 10:32 ?1055次閱讀

    揭秘高質(zhì)量點(diǎn)焊機(jī)的五大標(biāo)準(zhǔn):打造焊接性能的基石

    在現(xiàn)代工業(yè)生產(chǎn)領(lǐng)域,點(diǎn)焊機(jī)的重要性不言而喻。高質(zhì)量的點(diǎn)焊機(jī)如同一位技藝精湛的工匠,確保了不同材料間的牢固連接,其出色的焊接性能、穩(wěn)定的工作狀態(tài)和用戶友好的操作界面,已經(jīng)獲得了業(yè)界的高度評價。那么
    的頭像 發(fā)表于 09-12 15:26 ?1006次閱讀
    揭秘<b class='flag-5'>高質(zhì)量</b>點(diǎn)焊機(jī)的五大標(biāo)準(zhǔn):打造焊接性能的基石

    NVIDIA Nemotron-4 340B模型幫助開發(fā)者生成合成訓(xùn)練數(shù)據(jù)

    Nemotron-4 340B 是針對 NVIDIA NeMoNVIDIA TensorRT-LLM 優(yōu)化的模型系列,該系列包含最先進(jìn)的指導(dǎo)和獎勵模型,以及一個用于生成式 AI
    的頭像 發(fā)表于 09-06 14:59 ?738次閱讀
    <b class='flag-5'>NVIDIA</b> Nemotron-4 340B模型幫助開發(fā)者<b class='flag-5'>生成</b>合成訓(xùn)練數(shù)據(jù)

    NVIDIA Broadcast助力實(shí)現(xiàn)高質(zhì)量直播和遠(yuǎn)程工作

    AI 為計算領(lǐng)域帶來了深遠(yuǎn)的改變。雖然最近的焦點(diǎn)是生成式 AI,但多年來,由 NVIDIA RTX 提供支持的 AI 加速工具也在改善游戲、內(nèi)容創(chuàng)作和工作效率方面起到了關(guān)鍵作用。
    的頭像 發(fā)表于 08-23 15:35 ?1098次閱讀