chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

NVIDIA Triton系列文章:開發(fā)資源說明

NVIDIA英偉達企業(yè)解決方案 ? 來源:NVIDIA英偉達企業(yè)解決方案 ? 作者:NVIDIA英偉達企業(yè)解 ? 2022-11-09 16:17 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

大部分要學習 Triton 推理服務器的入門者,都會被搜索引擎或網上文章引導至官方的https://developer.nvidia.com/nvidia-triton-inference-server處(如下截圖),然后從 “Get Started” 直接安裝服務器與用戶端軟件、創(chuàng)建基礎的模型倉、執(zhí)行一些最基本的范例。

075dc9d0-5f58-11ed-8abf-dac502259ad0.png

這條路徑雖然能在很短時間內跑起 Triton 的應用,但在未掌握整個應用架構之前便貿然執(zhí)行,反倒容易讓初學者陷入迷失的狀態(tài),因此建議初學者最好先對 Triton 項目有比較更完整的了解之后,再執(zhí)行前面的 “Get Started” 就會更容易掌握項目的精髓。

要獲得比較完整的 Triton 技術資料,就得到項目開源倉里去尋找。與 NVIDIA 其他放在 https://github.com/NVIDIA或https://github.com/NVIDIA-AI-IOT的項目不同,Triton 項目有獨立的開源倉,位置在https://github.com/triton-inference-server,進入開源倉后會看到如下截屏的內容:

0777b1f6-5f58-11ed-8abf-dac502259ad0.png

下面列出四大部分的技術資源:

1. Getting Start(新手上路):

這里提供三個鏈接,比較重要的是 “Quick Start(快速啟動)” 的部分,提供以下三個步驟就能輕松執(zhí)行 Triton 的基礎示范:

(1) Create a Model Repository(創(chuàng)建模型倉)

(2) Launch Triton(啟動Triton服務器與用戶端)

(3) Send an Inference Request(提交推理要求)

2. Production Documentation(生產文件):

這里最重要的是 “server documents on GitHub” 鏈接,點進去后會進入整個 Triton 項目中最完整的技術文件中心(如下圖),除 Installation 與 Getting Started 屬于入門范疇,其余 User Guide、API Guide、Additional Resources 與 Customization Guide 等四個部分,都是 Triton 推理服務器非常重要的技術內容。

079daa00-5f58-11ed-8abf-dac502259ad0.png

因此這個部分可以算得上是學習 Triton 服務器的最重要資源。

例如點擊 “User Guide” 之后,就會看到以下所條例的執(zhí)行步驟:

Creating a Model Repository

Writing a Model Configuration

Buillding a Model Pipeline

Managing Model Availablity

Collecting Server Metrics

Supporting Custom Ops/layers

Using the Client API

Analyzing Performance

Deploying on edge (Jetson)

3. Examples(范例):

這里的范例,比較重要的是指向https://github.com/NVIDIA/DeepLearningExamples鏈接,列出針對 NVIDIA Tensor Core 計算單元的深度學習模型列表,包括計算機視覺、NLP 自然語言處理、推薦系統(tǒng)、語音轉文字 / 文字轉語音、圖形神經網絡、時間序列等各種神經網絡模型細節(jié),包括網絡結構與相關參數(shù)的內容。

對于未來要在 Triton 服務器上,對于所使用的網絡后端進行性能優(yōu)化或者創(chuàng)建新的后端,會有很大的助益,但是對于初學者來說是相對艱澀的,因此現(xiàn)階段先不做深入的說明與示范。

4. Feedback(反饋):

這里會鏈接到https://github.com/triton-inference-server/server/issues問題中心,是 Triton 項目中最重要的技術問題解決資源之一,后面執(zhí)行過程中所遇到的問題,都可以先到這里來查看是否有人已經提出?如果沒有的話,也可以在這里提交自己所遇到的問題,項目負責人會提供合適的回復。

以上第 2、4 兩項資源,對初學者來說會有最大的幫助。接著看一下項目里 “釘住(Pinned)” 的 6 個倉(如下圖),是比較重要的基礎部分,涵蓋了 Triton 架構圖中的主要板塊。

07cfb18a-5f58-11ed-8abf-dac502259ad0.png

主要內容如下:

1. server 倉:

這里集成整個項目的主要內容,包括幾部分:

(1)deploy(部署):提供在阿里巴巴、亞馬遜等云資源的部署方式,以及基于 NVIDIA Fleet 指令集、GKE(Google kubernets Engine)、k8s、Helm 等應用平臺的各種部署方法;

(2)docker(容器):修正一些創(chuàng)建容器腳本的錯誤;

(3)docs(使用說明):就是前面 “生產文件(Production Documentation)” 的內容,這里不重復贅述;

(4)qa(質量優(yōu)化):由于 Triton 推理服務器有非常多優(yōu)化的環(huán)節(jié),在這個目錄下提供上百個不同狀況的優(yōu)化測試腳本;

(5)src(源代碼):目錄下存放整個 Triton 推理服務器的開源代碼(.cc)、頭文件(.h)與編譯腳本(CMakeLists.txt);

(6)其他代碼與腳本

2. core 倉:

此存儲庫包含實現(xiàn) Triton 核心功能的庫的源代碼和標頭。核心庫可以如下所述構建,并通過其 CAPI 直接使用。為了有用,核心庫必須與一個或多個后端配對。您可以在后端回購中了解有關后端的更多信息。

3. backend 倉:

提供創(chuàng)建 Triton 服務器后端(backend)的源代碼、腳本與工具?!昂蠖恕?是用來執(zhí)行不同深度學習模型的管理模塊,以深度學習框架進行封裝,例如 PyTorch、Tensorflow、ONNX Runtime 與 TensorRT 等等,用戶也可以為了性能目的,自行定義 C / C++ 封裝方式。

4. client 倉:

提供 Triton 用戶端的 C++ / Python / Java 開發(fā)接口、能生成適用于不同編程語言的 GRPC 開發(fā)接口的 protoc 編譯器,以及對應的用戶端范例;

5. model_analyzer 倉:

深度學習模型(model)是 Triton 推理服務器的最基礎組成元件,因此對分析模型的計算與內存需求是服務器性能的一項關鍵功能。這個 model_analyzer 模型分析工具是一種 CLI 工具,這款新工具可以自動化地從數(shù)百種組合中為 AI 模型選擇最佳配置,以實現(xiàn)最優(yōu)性能,同時確保應用程序所需的服務質量,能幫助開發(fā)人員更好地了解不同配置中的權衡,并選擇能夠最大化 Triton 的性能配置;

6. model_navigator 倉:

這個 model_navigator 模型導航器是一種能夠自動將模型從源移動到最佳格式和配置的工具,支持將模型從源導出為所有可能的格式,并應用 Triton 服務器的后端優(yōu)化。使用模型分析器能找到最佳的模型配置,匹配提供的約束條件并優(yōu)化性能。

以上是 Triton 開源項目里比較核心的 6 個倉,另外還有 20 多個代碼倉,其中大約 15 個是項目提供的后端(backend)擴充應用,例如 tensorrt_backend、fil_backend、square_backend 等等,以及一些額外的管理工具,并且不斷增加中。

本系列后面的內容都會基于這個 server 倉的 docs 目錄下的內容為主,按部就班地帶著讀者循序漸進創(chuàng)建與調試 Triton 推理服務器的運作環(huán)境。

審核編輯 :李倩

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • NVIDIA
    +關注

    關注

    14

    文章

    5496

    瀏覽量

    109119
  • 服務器
    +關注

    關注

    13

    文章

    10102

    瀏覽量

    90916

原文標題:NVIDIA Triton 系列文章(3):開發(fā)資源說明

文章出處:【微信號:NVIDIA-Enterprise,微信公眾號:NVIDIA英偉達企業(yè)解決方案】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    NVIDIA Omniverse Extension開發(fā)秘籍

    NVIDIA Omniverse 是一個模塊化平臺,使用高級 API 和微服務來構建由 OpenUSD 和 NVIDIA RTX 提供支持的 3D 應用。OpenUSD 功能強大的 3D 框架與 NVIDIA RTX 用于視覺渲
    的頭像 發(fā)表于 08-22 15:52 ?3424次閱讀
    <b class='flag-5'>NVIDIA</b> Omniverse Extension<b class='flag-5'>開發(fā)</b>秘籍

    使用NVIDIA Triton和TensorRT-LLM部署TTS應用的最佳實踐

    針對基于 Diffusion 和 LLM 類別的 TTS 模型,NVIDIA Triton 和 TensorRT-LLM 方案能顯著提升推理速度。在單張 NVIDIA Ada Lovelace
    的頭像 發(fā)表于 06-12 15:37 ?1321次閱讀
    使用<b class='flag-5'>NVIDIA</b> <b class='flag-5'>Triton</b>和TensorRT-LLM部署TTS應用的最佳實踐

    【米爾-全志T536開發(fā)板試用體驗】開發(fā)資源關鍵要點

    (ENET1/2千兆,ENET3 USB轉百兆)。 六、資源獲取與支持 官方文檔:米爾提供原理圖、PCB源文件(Allegro格式)及預配置Docker開發(fā)環(huán)境。
    發(fā)表于 04-14 23:06

    使用NVIDIA RTX PRO Blackwell系列GPU加速AI開發(fā)

    NVIDIA GTC 推出新一代專業(yè)級 GPU 和 AI 賦能的開發(fā)者工具—同時,ChatRTX 更新現(xiàn)已支持 NVIDIA NIM,RTX Remix 正式結束測試階段,本月的 NVIDIA
    的頭像 發(fā)表于 03-28 09:59 ?1085次閱讀

    NVIDIA宣布NVIDIA Isaac重要更新

    ,更為全球開發(fā)者提供了更加強大、高效的工具,以加速AI機器人的開發(fā)進程。 NVIDIA Isaac是一個綜合性的平臺,它集成了加速庫、應用框架和AI模型等多種資源。這些組件協(xié)同工作,為
    的頭像 發(fā)表于 01-17 14:45 ?845次閱讀

    Triton編譯器與GPU編程的結合應用

    Triton編譯器簡介 Triton編譯器是一種針對并行計算優(yōu)化的編譯器,它能夠自動將高級語言代碼轉換為針對特定硬件優(yōu)化的低級代碼。Triton編譯器的核心優(yōu)勢在于其能夠識別并行模式,自動進行代碼
    的頭像 發(fā)表于 12-25 09:13 ?1339次閱讀

    Triton編譯器如何提升編程效率

    在現(xiàn)代軟件開發(fā)中,編譯器扮演著至關重要的角色。它們不僅將高級語言代碼轉換為機器可執(zhí)行的代碼,還通過各種優(yōu)化技術提升程序的性能。Triton 編譯器作為一種先進的編譯器,通過多種方式提升編程效率,使得
    的頭像 發(fā)表于 12-25 09:12 ?1217次閱讀

    Triton編譯器在高性能計算中的應用

    高性能計算(High-Performance Computing,HPC)是現(xiàn)代科學研究和工程計算中不可或缺的一部分。隨著計算需求的不斷增長,對計算資源的要求也越來越高。Triton編譯器作為一種
    的頭像 發(fā)表于 12-25 09:11 ?1593次閱讀

    Triton編譯器的優(yōu)化技巧

    在現(xiàn)代計算環(huán)境中,編譯器的性能對于軟件的運行效率至關重要。Triton 編譯器作為一個先進的編譯器框架,提供了一系列的優(yōu)化技術,以確保生成的代碼既高效又適應不同的硬件架構。 1. 指令選擇
    的頭像 發(fā)表于 12-25 09:09 ?1895次閱讀

    Triton編譯器的優(yōu)勢與劣勢分析

    Triton編譯器作為一種新興的深度學習編譯器,具有一系列顯著的優(yōu)勢,同時也存在一些潛在的劣勢。以下是對Triton編譯器優(yōu)勢與劣勢的分析: 優(yōu)勢 高效性能優(yōu)化 : Triton編譯器
    的頭像 發(fā)表于 12-25 09:07 ?1888次閱讀

    Triton編譯器在機器學習中的應用

    1. Triton編譯器概述 Triton編譯器是NVIDIA Triton推理服務平臺的一部分,它負責將深度學習模型轉換為優(yōu)化的格式,以便在NVI
    的頭像 發(fā)表于 12-24 18:13 ?1646次閱讀

    Triton編譯器的常見問題解決方案

    Triton編譯器作為一款專注于深度學習的高性能GPU編程工具,在使用過程中可能會遇到一些常見問題。以下是一些常見問題的解決方案: 一、安裝與依賴問題 檢查Python版本 Triton編譯器通常
    的頭像 發(fā)表于 12-24 18:04 ?6454次閱讀

    Triton編譯器支持的編程語言

    編寫和優(yōu)化深度學習代碼。Python是一種廣泛使用的高級編程語言,具有簡潔易讀、易于上手、庫豐富等特點,非常適合用于深度學習應用的開發(fā)。 二、領域特定語言(DSL) Triton也提供了一種針對深度學習領域的特定編程語言(DSL),這種語言是基于C/C++或Python等
    的頭像 發(fā)表于 12-24 17:33 ?1490次閱讀

    Triton編譯器與其他編譯器的比較

    Triton編譯器與其他編譯器的比較主要體現(xiàn)在以下幾個方面: 一、定位與目標 Triton編譯器 : 定位:專注于深度學習中最核心、最耗時的張量運算的優(yōu)化。 目標:提供一個高度抽象、靈活、高效
    的頭像 發(fā)表于 12-24 17:25 ?1608次閱讀

    Triton編譯器功能介紹 Triton編譯器使用教程

    Triton 是一個開源的編譯器前端,它支持多種編程語言,包括 C、C++、Fortran 和 Ada。Triton 旨在提供一個可擴展和可定制的編譯器框架,允許開發(fā)者添加新的編程語言特性和優(yōu)化技術
    的頭像 發(fā)表于 12-24 17:23 ?2737次閱讀