chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

使用遷移學習定制人工智能深度學習模型

星星科技指導員 ? 來源:NVIDIA ? 作者:About Tanay Varshney, ? 2022-04-01 09:11 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

從頭開始創(chuàng)建一個新的人工智能深度學習模型是一個非常耗費時間和資源的過程。解決這個問題的一個常見方法是采用遷移學習。為了使這一過程更加簡單,NVIDIA TAO Toolkit,它可以將工程時間框架從 80 周縮短到 8 周。 TAO 工具包支持計算機視覺和對話 AI ( ASR 和 NLP )用例。

在本文中,我們將介紹以下主題:

安裝 TAO 工具包并訪問預訓練模型

微調預訓練語音轉錄模型

將微調模型導出到 NVIDIA Riva

跟隨 download the Jupyter notebook。

安裝 TAO 工具包并下載預訓練模型

在安裝 TAO 工具包之前,請確保您的系統上安裝了以下組件:

Python [3 。 6 。 9]

docker ce 》 19 。 03 。 5

nvidia-DOCKR2 3 。 4 。 0-1

有關安裝 nvidia docker 和 docker 的更多信息,請參閱Prerequisites。您可以使用 pip 安裝 TAO 工具包。我們建議使用virtual environment以避免版本沖突。

安裝完成后,下一步是獲得一些經過預訓練的模型。 NVIDIA 提供了許多人工智能或機器學習模型,不僅在對話人工智能領域,而且在 NGC 或 NVIDIA GPU 云上的廣泛領域。 NGC 目錄是一套精心策劃的 GPU 優(yōu)化軟件,用于 AI 、 HPC 和可視化。

要從 NGC 下載資源,請使用NGC API key登錄注冊表。您可以免費創(chuàng)建和使用一個。

圖 1 。獲取 NGCAPI 密鑰

CitriNet是由 NVIDIA 構建的最先進的自動語音識別( ASR )模型,可用于生成語音轉錄。您可以從Speech to Text English Citrinet型號卡下載此型號。

為了提供流暢的體驗,工具包在后臺下載并運行 Docker 容器,使用前面提到的規(guī)范文件。所有細節(jié)都隱藏在 TAO 啟動器中。您可以通過定義 JSON 文件~/.tao_mounts.json來指定裝載 Docker 容器的首選位置。您可以在Jupyter notebook中找到裝載文件。

這樣,您就安裝了 TAO 工具包,下載了一個經過預訓練的 ASR 模型,并指定了 TAO 工具包啟動器的安裝點。在下一節(jié)中,我們將討論如何使用 TAO 工具包在您選擇的數據集上微調此模型。

微調模型

使用 TAO 工具包微調模型包括三個步驟:

下載規(guī)范文件。

預處理數據集。

使用超參數進行微調。

圖 3 顯示了微調模型所需的步驟。

圖 2 。 TAO 工具包工作流

步驟 1 :下載規(guī)范文件

NVIDIA TAO Toolkit 是一種低代碼或無代碼的解決方案,通過規(guī)范文件簡化模型的培訓或微調。通過這些文件,您可以自定義特定于模型的參數、培訓師參數、優(yōu)化器和所用數據集的參數??梢詫⑦@些規(guī)范文件下載到先前裝載的文件夾:

以下是 TAO 工具包附帶的 YAML 文件。有關更多信息,請參閱Downloading Sample Spec Files。

create_tokenizer.yaml

dataset_convert_an4.yaml

dataset_convert_en.yaml

dataset_convert_ru.yaml

evaluate.yaml

export.yaml

finetune.yaml

infer_onnx.yaml

infer.yaml

train_citrinet_256.yaml

train_citrinet_bpe.yaml

這些規(guī)范文件可供自定義和使用。從預處理和模型評估到推理和導出模型,都有相應的功能。這使您能夠完成開發(fā)或定制模型的過程,而無需構建復雜的代碼庫。下載等級庫文件后,現在可以繼續(xù)預處理數據。

步驟 2 :預處理數據集

在本演練中,您將使用CMU’s AN4 Dataset,這是一個小型普查數據集,其中包含地址、數字和其他個人信息的記錄。這與客戶支持對話中對話的初始步驟所需的轉錄類型類似。具有類似內容的較大自定義數據集可用于實際應用程序。

您可以直接下載和解壓縮 AN4 數據集,或使用以下命令:

TAO 工具包培訓和微調模塊期望數據以特定格式呈現??梢允褂?dataset _ convert 命令完成此預處理。我們將 AN4 和 Mozilla 的通用語音數據集的規(guī)范文件與 TAO 啟動器一起打包。您可以在步驟 1 中定義的目錄中找到這些規(guī)范文件。

這些清單文件(圖 3 )包含在后面的步驟中使用的以下信息:

音頻文件的路徑

每個文件的持續(xù)時間

每個文件的文字內容

圖 3 。已處理清單文件的結構

此命令將音頻文件轉換為 WAV 文件,并生成訓練和測試清單文件。

在大多數情況下,您都會進行預處理,但 CitriNet 模型是一個特例。它需要以子詞標記化的形式進行進一步處理,為文本創(chuàng)建子詞詞匯表。這與 Jasper 或 QuartzNet 不同,因為在它們的情況下,詞匯表中只有單個字符被視為元素。在 CitriNet 中,子字可以是一個或多個字符。這可以使用以下命令完成:

到目前為止,您已經建立了一個工具,為諸如遷移學習之類的復雜問題提供低代碼或無代碼解決方案。您已經下載了一個預訓練的模型,將音頻文件處理為必要的格式,并執(zhí)行了標記化。您使用的命令不到 10 個。現在,所有必要的細節(jié)都已散列出來,您可以繼續(xù)微調模型。

步驟 3 :使用超參數進行微調

正如在前面的步驟中所做的那樣,您正在與規(guī)范文件交互。有關更多信息,請參閱Creating an Experiment Spec File。如果要調整 FFT 窗口大小的大小,可以指定幾乎所有內容,從特定于訓練的參數(如優(yōu)化器)到特定于數據集的參數,再到模型配置本身。

是否要更改學習速率和調度程序,或者在詞匯表中添加新字符?無需打開代碼庫并對其進行掃描以進行更改。所有這些定制都很容易獲得,并可在整個團隊中共享。這減少了在嘗試新想法和分享結果以及模型配置方面的摩擦,從而提高了準確性。

以下是如何微調數據集:

最后,要繼續(xù),請根據需要修改規(guī)范文件并運行以下命令。此命令使用先前下載的數據集微調下載的模型。有關更多信息,請參閱Fine-Tuning the Model。

在對模型進行微調或培訓后,自然會評估模型并評估是否需要進一步微調。為此, NVIDIA 為evaluate your model和run inference提供了功能。

將微調模型導出到 Riva

在生產環(huán)境中部署模型會帶來一系列挑戰(zhàn)。為此,您可以使用NVIDIA Riva,一種 GPU 加速 AI 語音 SDK 來開發(fā)實時轉錄和虛擬助理等應用程序。

Riva 使用其他 NVIDIA 產品:

NVIDIA Triton Inference Server用于簡化大規(guī)模生產中模型的部署。

NVIDIA TensorRT用于通過優(yōu)化 NVIDIA GPU s 的模型來加速模型并提供更好的推理性能。

如果您對使用本演練中微調的模型感興趣,可以使用以下命令將其導出到 Riva 。

在下一篇文章中,我們將介紹如何安裝 NVIDIA Riva 在生產環(huán)境中部署這些模型,以及如何使用NGC Catalog中的眾多模型之一。

關于作者

About Tanay Varshney

Tanay Varshney 是 NVIDIA 的一名深入學習的技術營銷工程師,負責廣泛的 DL 軟件產品。他擁有紐約大學計算機科學碩士學位,專注于計算機視覺、數據可視化和城市分析的橫斷面。

About Sirisha Rella

Sirisha Rella 是 NVIDIA 的技術產品營銷經理,專注于計算機視覺、語音和基于語言的深度學習應用。 Sirisha 獲得了密蘇里大學堪薩斯城分校的計算機科學碩士學位,是國家科學基金會大學習中心的研究生助理。

審核編輯:郭婷

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規(guī)問題,請聯系本站處理。 舉報投訴
  • NVIDIA
    +關注

    關注

    14

    文章

    5496

    瀏覽量

    109109
  • 人工智能
    +關注

    關注

    1813

    文章

    49746

    瀏覽量

    261596
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    利用超微型 Neuton ML 模型解鎖 SoC 邊緣人工智能

    的框架小 10 倍,速度也快 10 倍,甚至可以在最先進的邊緣設備上進行人工智能處理。在這篇博文中,我們將介紹這對開發(fā)人員意味著什么,以及使用 Neuton 模型如何改進您的開發(fā)和終端
    發(fā)表于 08-31 20:54

    自動駕駛中Transformer大模型會取代深度學習嗎?

    [首發(fā)于智駕最前沿微信公眾號]近年來,隨著ChatGPT、Claude、文心一言等大語言模型在生成文本、對話交互等領域的驚艷表現,“Transformer架構是否正在取代傳統深度學習”這一話題一直被
    的頭像 發(fā)表于 08-13 09:15 ?3922次閱讀
    自動駕駛中Transformer大<b class='flag-5'>模型</b>會取代<b class='flag-5'>深度</b><b class='flag-5'>學習</b>嗎?

    挖到寶了!人工智能綜合實驗箱,高校新工科的寶藏神器

    應用場景。從數據采集,到模型推理,都能完整且自如地參與,輕松解鎖人工智能全流程實訓,讓你深度體驗AI技術的魅力 。 四、九門課程全覆蓋,滿足多元學習需求 對于高校教學或者技術
    發(fā)表于 08-07 14:30

    挖到寶了!比鄰星人工智能綜合實驗箱,高校新工科的寶藏神器!

    應用場景。從數據采集,到模型推理,都能完整且自如地參與,輕松解鎖人工智能全流程實訓,讓你深度體驗AI技術的魅力 。 四、九門課程全覆蓋,滿足多元學習需求 對于高校教學或者技術
    發(fā)表于 08-07 14:23

    超小型Neuton機器學習模型, 在任何系統級芯片(SoC)上解鎖邊緣人工智能應用.

    Neuton 是一家邊緣AI 公司,致力于讓機器 學習模型更易于使用。它創(chuàng)建的模型比競爭對手的框架小10 倍,速度也快10 倍,甚至可以在最先進的邊緣設備上進行人工智能處理。在這篇博文
    發(fā)表于 07-31 11:38

    人工智能學習17問:從入門到避坑,新手最關心的問題全在這

    問:學人工智能,光看書就行?答:不行。AI是“練出來”的,不是“看出來”的。書能教理論,但寫代碼、調模型、解決實際問題的能力,必須靠動手練。利用學習平臺把書本知識拆解成可操作的步驟,跟著練3次,比看
    的頭像 發(fā)表于 07-30 14:18 ?481次閱讀
    <b class='flag-5'>人工智能</b><b class='flag-5'>學習</b>17問:從入門到避坑,新手最關心的問題全在這

    人工智能技術的現狀與未來發(fā)展趨勢

    人工智能技術的現狀與未來發(fā)展趨勢 ? ? 近年來,人工智能(AI)技術迅猛發(fā)展,深刻影響著各行各業(yè)。從計算機視覺到自然語言處理,從自動駕駛到醫(yī)療診斷,AI的應用場景不斷擴展,推動社會向智能化方向邁進
    的頭像 發(fā)表于 07-16 15:01 ?1196次閱讀

    最新人工智能硬件培訓AI 基礎入門學習課程參考2025版(大模型篇)

    人工智能模型重塑教育與社會發(fā)展的當下,無論是探索未來職業(yè)方向,還是更新技術儲備,掌握大模型知識都已成為新時代的必修課。從職場上輔助工作的智能助手,到課堂用于學術研究的
    發(fā)表于 07-04 11:10

    邊緣計算如何顛覆人工智能變革

    2025年以來,DeepSeek發(fā)布的大模型熱度居高不下,再次點燃了全球對人工智能的無限熱情。深度學習模型以指數級速度膨脹,性能不斷突破極限
    的頭像 發(fā)表于 05-30 09:29 ?835次閱讀

    用樹莓派搞深度學習?TensorFlow啟動!

    RaspberryPi4上運行TensorFlow,但不要期望有奇跡般的表現。如果模型不太復雜,它可以運行您的模型,但無法訓練新模型,也無法執(zhí)行所謂的遷移
    的頭像 發(fā)表于 03-25 09:33 ?968次閱讀
    用樹莓派搞<b class='flag-5'>深度</b><b class='flag-5'>學習</b>?TensorFlow啟動!

    軍事應用中深度學習的挑戰(zhàn)與機遇

    人工智能尤其是深度學習技術的最新進展,加速了不同應用領域的創(chuàng)新與發(fā)展。深度學習技術的發(fā)展深刻影響了軍事發(fā)展趨勢,導致戰(zhàn)爭形式和模式發(fā)生重大變
    的頭像 發(fā)表于 02-14 11:15 ?823次閱讀

    小白學解釋性AI:從機器學習到大模型

    科學AI需要可解釋性人工智能的崛起,尤其是深度學習的發(fā)展,在眾多領域帶來了令人矚目的進步。然而,伴隨這些進步而來的是一個關鍵問題——“黑箱”問題。許多人工智能
    的頭像 發(fā)表于 02-10 12:12 ?1153次閱讀
    小白學解釋性AI:從機器<b class='flag-5'>學習</b>到大<b class='flag-5'>模型</b>

    數學專業(yè)轉人工智能方向:考研/就業(yè)前景分析及大學四年學習路徑全揭秘

    隨著AI技術的不斷進步,專業(yè)人才的需求也日益增長。數學作為AI的基石,為機器學習深度學習、數據分析等提供了理論基礎和工具,因此越來越多的數學專業(yè)學生開始考慮在人工智能領域發(fā)展。本文主
    的頭像 發(fā)表于 02-07 11:14 ?1703次閱讀
    數學專業(yè)轉<b class='flag-5'>人工智能</b>方向:考研/就業(yè)前景分析及大學四年<b class='flag-5'>學習</b>路徑全揭秘

    人工智能和機器學習以及Edge AI的概念與應用

    人工智能相關各種技術的概念介紹,以及先進的Edge AI(邊緣人工智能)的最新發(fā)展與相關應用。 人工智能和機器學習是現代科技的核心技術 人工智能
    的頭像 發(fā)表于 01-25 17:37 ?1582次閱讀
    <b class='flag-5'>人工智能</b>和機器<b class='flag-5'>學習</b>以及Edge AI的概念與應用

    啟明云端攜手文心大模型,共探人工智能新紀元

    人工智能的浪潮中,大模型技術以其強大的數據處理能力和深度學習能力,正成為推動產業(yè)升級和創(chuàng)新的核心引擎。12月19日,文心中國行走進廣州,啟明云端作為文心大
    的頭像 發(fā)表于 12-20 15:58 ?1048次閱讀
    啟明云端攜手文心大<b class='flag-5'>模型</b>,共探<b class='flag-5'>人工智能</b>新紀元