chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

NVIDIA Triton的概念、特性及主要功能

NVIDIA英偉達(dá)企業(yè)解決方案 ? 來源:NVIDIA英偉達(dá)企業(yè)解決方案 ? 作者:NVIDIA英偉達(dá)企業(yè)解 ? 2022-07-18 10:11 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

NVIDIA Triton 推理服務(wù)器是 NVIDIA AI 平臺的一部分,它是一款開源推理服務(wù)軟件,可助力標(biāo)準(zhǔn)化模型的部署和執(zhí)行,并在生產(chǎn)環(huán)境中提供快速且可擴展的 AI。

什么是 NVIDIA Triton?

NVIDIA Triton 推理服務(wù)器可助力團隊在任意基于 GPUCPU 的基礎(chǔ)設(shè)施上部署、運行和擴展任意框架中經(jīng)過訓(xùn)練的 AI 模型,進而精簡 AI 推理。同時,AI 研究人員和數(shù)據(jù)科學(xué)家可在不影響生產(chǎn)部署的情況下,針對其項目自由選擇合適的框架。它還幫助開發(fā)者跨云、本地、邊緣和嵌入式設(shè)備提供高性能推理。

NVIDIA Triton特性

支持多個框架

NVIDIA Triton 推理服務(wù)器支持所有主流框架,例如 TensorFlow、NVIDIA TensorRT、PyTorch、MXNet、Python、ONNX、RAPIDS FIL(用于XGBoost、scikit-learn 等)、OpenVINO、自定義 C++ 等。

高性能推理

NVIDIA Triton 支持所有基于 NVIDIA GPU、x86 和 ArmCPU 的推理。它具有動態(tài)批處理、并發(fā)執(zhí)行、最優(yōu)模型配置、模型集成和串流輸入等功能,可更大限度地提高吞吐量和利用率。

專為 DevOps 和 MLOps 設(shè)計

Triton 與 Kubernetes 集成,可用于編排和擴展,導(dǎo)出 Prometheus 指標(biāo)進行監(jiān)控,支持實時模型更新,并可用于所有主流的公有云 AI 和 Kubernetes 平臺。它還與許多 MLOps 軟件解決方案集成。

各項應(yīng)用中快速且可擴展的AI

高推理吞吐量

0f9e53ee-0431-11ed-ba43-dac502259ad0.jpg

NVIDIA Triton 可在單個 GPU 或 CPU 上并行指定相同或不同框架下的多個模型。在多 GPU 服務(wù)器中,NVIDIA Triton 會自動為基于每個 GPU 的每個模型創(chuàng)建一個實例,以提高利用率。

它還可在嚴(yán)格的延遲限制條件下優(yōu)化實時推理服務(wù),通過支持批量推理來更大限度地提高 GPU 和 CPU 利用率,并內(nèi)置對音頻和視頻流輸入的支持。對于需要使用多個模型來執(zhí)行端到端推理(例如對話式 AI)的用例,Triton 支持模型集成。

模型可在生產(chǎn)環(huán)境中實時更新,無需重啟 Triton 或應(yīng)用。Triton 支持對單個 GPU 顯存無法容納的超大模型進行多 GPU 以及多節(jié)點推理。

高度可擴展的推理

0faecbe8-0431-11ed-ba43-dac502259ad0.jpg

作為一個 Docker 容器,Triton 與 Kubernetes 集成,用于編排、指標(biāo)和自動縮放。Triton 還與 Kubeflow 和 Kubeflow 工作流集成,實現(xiàn)端到端的 AI 工作流,并導(dǎo)出 Prometheus 指標(biāo),用于監(jiān)控 GPU 利用率、延遲、內(nèi)存使用率和推理吞吐量。它支持標(biāo)準(zhǔn)的 HTTP / gRPC 接口,可與 load balancer 等其他應(yīng)用連接,并可輕松擴展到任意數(shù)量的服務(wù)器,以為任意模型處理日益增長的推理負(fù)載。

Triton 可通過一個模型控制 API 來服務(wù)于數(shù)十或數(shù)百個模型。您可基于為適應(yīng) GPU 或 CPU 顯存而進行的改動,將模型加載到推理服務(wù)器中或從推理服務(wù)器中卸載。支持兼具 GPU 和 CPU 的異構(gòu)集群有助于跨平臺實現(xiàn)推理標(biāo)準(zhǔn)化,并動態(tài)擴展到任意 CPU 或 GPU 以處理峰值負(fù)載。

NVIDIA Triton的主要功能

Triton Forest Inference Library (FIL) 后端

新的 Forest Inference Library (FIL) 后端支持在 CPU 和 GPU 上對基于樹的模型進行具有可解釋性(Shapley 值)的高性能推理。它支持來自 XGBoost、LightGBM、scikit-learn RandomForest、RAPIDS cuML RandomForest 以及其他 Treelite 格式的模型。

Triton 模型分析器

Triton 模型分析器是一種自動評估 Triton 部署配置(例如目標(biāo)處理器上的批量大小、精度和并發(fā)執(zhí)行實例)的工具。它有助于選擇優(yōu)化配置,以滿足應(yīng)用的服務(wù)質(zhì)量(QoS)限制(延遲、吞吐量和內(nèi)存要求),并且可以將找到優(yōu)化配置所需的時間從數(shù)周縮短到數(shù)小時。

審核編輯:湯梓紅

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • NVIDIA
    +關(guān)注

    關(guān)注

    14

    文章

    5496

    瀏覽量

    109119
  • 服務(wù)器
    +關(guān)注

    關(guān)注

    13

    文章

    10102

    瀏覽量

    90916
  • Triton
    +關(guān)注

    關(guān)注

    0

    文章

    28

    瀏覽量

    7277

原文標(biāo)題:DevZone | NVIDIA Triton推理服務(wù)器

文章出處:【微信號:NVIDIA-Enterprise,微信公眾號:NVIDIA英偉達(dá)企業(yè)解決方案】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    綜合配電柜主要功能喝應(yīng)用場景是什么

    是綜合配電柜的主要功能和應(yīng)用場景的詳細(xì)說明: 一、核心功能 電能分配 將輸入的電力(如三相電或單相電)通過斷路器、隔離開關(guān)等設(shè)備分配到多個輸出回路,為不同負(fù)載(如電機、照明、空調(diào)等)提供獨立電源。 支持多路輸出,滿足復(fù)
    的頭像 發(fā)表于 10-10 10:41 ?301次閱讀

    醫(yī)院專用數(shù)據(jù)記錄儀主要功能有哪些

    數(shù)據(jù)記錄儀的主要功能在于采集、存儲并分析各類數(shù)據(jù),在眾多領(lǐng)域有著廣泛而深入的應(yīng)用,為不同行業(yè)的發(fā)展帶來了新的活力與變革。那么,醫(yī)院專用數(shù)據(jù)記錄儀主要功能有哪些?有何產(chǎn)品推薦?下面就讓小編來為大家簡單
    發(fā)表于 09-28 14:53

    窗口看門狗定時器(WWDT)的主要功能是什么?

    窗口看門狗定時器(WWDT)的主要功能是什么?
    發(fā)表于 08-26 06:23

    手持采集器是干什么用的 PDA采集器的主要功能與應(yīng)用場景

    的“得力助手”。下面就來詳細(xì)說說手持采集器的主要功能和常見應(yīng)用場景。一、手持采集器的核心功能1.多形式數(shù)據(jù)采集手持采集器最核心的能力就是“采集”,它支持條形碼、二維碼
    的頭像 發(fā)表于 08-20 15:09 ?843次閱讀
    手持采集器是干什么用的 PDA采集器的<b class='flag-5'>主要功能</b>與應(yīng)用場景

    PLC溫度控制系統(tǒng)的主要功能

    PLC溫度控制系統(tǒng)作為工業(yè)加熱、恒溫場景的核心控制單元,通過整合傳感器、執(zhí)行器與邏輯控制算法,實現(xiàn)對溫度的精準(zhǔn)調(diào)控,其主要功能可歸納為以下六大核心模塊: 一、實時溫度檢測與采集 系統(tǒng)
    的頭像 發(fā)表于 08-07 17:59 ?753次閱讀

    一維二維碼條碼識讀器的主要功能有哪些

    在信息化快速發(fā)展的當(dāng)下,一維二維碼條碼識讀器已成為各行各業(yè)高效處理信息的重要工具。從超市收銀到物流追蹤,它憑借快速準(zhǔn)確的信息識別能力,大幅提升了工作效率。那么,一維二維碼條碼識讀器的主要功能有哪些呢
    的頭像 發(fā)表于 08-01 15:59 ?766次閱讀
    一維二維碼條碼識讀器的<b class='flag-5'>主要功能</b>有哪些

    圖像采集卡的主要功能與應(yīng)用

    圖像采集卡是一種安裝在計算機內(nèi)部(通常是PCIe插槽)或通過外部接口(如USB3.0,)連接的硬件設(shè)備。它的主要功能是將來自攝像頭、攝像機、傳感器或其他視頻源的模擬或數(shù)字視頻信號,捕獲、數(shù)字化并傳輸
    的頭像 發(fā)表于 07-23 13:47 ?728次閱讀
    圖像采集卡的<b class='flag-5'>主要功能</b>與應(yīng)用

    直流負(fù)載箱的主要功能有哪些?

    直流負(fù)載箱是專門用于模擬和測試直流電源系統(tǒng)負(fù)載的設(shè)備,其主要功能包括以下幾點: 直流負(fù)載箱可以模擬各種不同類型的負(fù)載,如電阻、電感、電容等,以滿足不同應(yīng)用場景的需求。通過調(diào)整負(fù)載箱的參數(shù),可以實現(xiàn)
    發(fā)表于 06-17 13:34

    使用NVIDIA Triton和TensorRT-LLM部署TTS應(yīng)用的最佳實踐

    針對基于 Diffusion 和 LLM 類別的 TTS 模型,NVIDIA Triton 和 TensorRT-LLM 方案能顯著提升推理速度。在單張 NVIDIA Ada Lovelace
    的頭像 發(fā)表于 06-12 15:37 ?1321次閱讀
    使用<b class='flag-5'>NVIDIA</b> <b class='flag-5'>Triton</b>和TensorRT-LLM部署TTS應(yīng)用的最佳實踐

    Aigtek:功率放大器的主要功能有哪些

    功率放大器是一種重要的電子設(shè)備,其主要功能是將輸入信號的功率增加到足夠高的水平,以便推動負(fù)載或驅(qū)動輸出設(shè)備。功率放大器在各個領(lǐng)域中都具有廣泛的應(yīng)用,例如音頻系統(tǒng)、射頻通信、雷達(dá)、無線電等。下面安泰
    的頭像 發(fā)表于 03-19 10:40 ?577次閱讀
    Aigtek:功率放大器的<b class='flag-5'>主要功能</b>有哪些

    Abaqus軟件介紹:主要功能及模塊、優(yōu)勢與特點等

    通過有限元方法對各種工程問題進行數(shù)值模擬,幫助工程師和研究人員優(yōu)化設(shè)計、提高產(chǎn)品性能和安全性。 2. 主要功能 結(jié)構(gòu)分析:Abaqus能夠
    的頭像 發(fā)表于 02-13 09:44 ?2865次閱讀

    電流感應(yīng)放大器主要功能_電流感應(yīng)放大器工作原理

    電流感應(yīng)放大器是一種基于磁耦合原理的電路,主要功能包括以下幾個方面:   一、信號放大   電流感應(yīng)放大器的主要功能之一是將低電平的信號放大到可以被檢測的范圍內(nèi)。在電子測量、工業(yè)自動化
    的頭像 發(fā)表于 01-27 11:39 ?2155次閱讀

    繼電器的主要功能與應(yīng)用

    、溫度繼電器等。 按工作原理分類 :電磁繼電器、靜態(tài)繼電器、固態(tài)繼電器等。 按用途分類 :保護繼電器、控制繼電器、信號繼電器等。 二、繼電器的主要功能 信號放大 :繼電器可以將微弱的信號放大到足以驅(qū)動其他設(shè)備的信號強度。
    的頭像 發(fā)表于 12-28 09:33 ?2959次閱讀

    Triton編譯器在機器學(xué)習(xí)中的應(yīng)用

    1. Triton編譯器概述 Triton編譯器是NVIDIA Triton推理服務(wù)平臺的一部分,它負(fù)責(zé)將深度學(xué)習(xí)模型轉(zhuǎn)換為優(yōu)化的格式,以便在NVI
    的頭像 發(fā)表于 12-24 18:13 ?1645次閱讀

    Triton編譯器功能介紹 Triton編譯器使用教程

    Triton 是一個開源的編譯器前端,它支持多種編程語言,包括 C、C++、Fortran 和 Ada。Triton 旨在提供一個可擴展和可定制的編譯器框架,允許開發(fā)者添加新的編程語言特性和優(yōu)化技術(shù)
    的頭像 發(fā)表于 12-24 17:23 ?2736次閱讀