chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

如何使用FIL后端部署XGBOOST模型

星星科技指導員 ? 來源:NVIDIA ? 作者:William Hicks ? 2022-04-11 14:35 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

深度神經(jīng)網(wǎng)絡在多個領(lǐng)域的成功促使人們對如何有效地部署這些模型以用于實際應用進行了大量思考和努力。然而,盡管基于樹的模型(包括隨機森林和梯度增強模型)在表格數(shù)據(jù)分析中 continued dominance 非常重要,而且對于解釋性非常重要的用例非常重要,但加速部署基于樹的模型(包括隨機森林和梯度增強模型)的努力卻沒有受到太多關(guān)注。

隨著 DoorDash 和 CapitalOne 等組織轉(zhuǎn)向基于樹的模型來分析大量關(guān)鍵任務數(shù)據(jù),提供工具以幫助部署此類模型變得簡單、高效和高效變得越來越重要。

NVIDIA Triton 推理服務器 提供在 CPUGPU 上部署深度學習模型的完整解決方案,支持多種框架和模型執(zhí)行后端,包括 PyTorch 、 TensorFlow 、 ONNX 、 TensorRT 等。從 21.06.1 版開始,為了補充 NVIDIA Triton 推理服務器現(xiàn)有的深度學習功能,新的 林推理庫( FIL )后端 提供了對樹模型的支持,例如 XGBoost 、 LightGBM 、 Scikit-Learn RandomForest , RAPIDS 卡米爾森林 ,以及 Treelite 支持的任何其他型號。

基于 RAPIDS 森林推理庫 (NVIDIA ),NVIDIA Triton 推理服務器 FIL 后端允許用戶利用 NVIDIA Triton 推理服務器的相同特性,以達到 deep learning 模型的最優(yōu)吞吐量/延遲,以在相同的系統(tǒng)上部署基于樹的模型。

在本文中,我們將簡要介紹NVIDIA Triton 推理服務器本身,然后深入介紹如何使用 FIL 后端部署 XGBOOST 模型的示例。使用 NVIDIA GPU ,我們將看到,我們不必總是在部署更精確的模型或保持延遲可控之間做出選擇。

在示例筆記本中,通過利用 FIL 后端的 GPU 加速推理,在一臺配備八臺 V100 GPU 的 NVIDIA DGX-1 服務器上,我們將能夠部署比 CPU 更復雜的欺詐檢測模型,同時將 p99 延遲保持在 2ms 以下, still 每秒提供超過 400K 的推斷( 630MB / s ),或者比 CPU 上的吞吐量高 20 倍。

NVIDIA Triton 推理服務器

NVIDIA Triton 推理服務器為 machine learning 模型的實時服務提供了完整的開源解決方案。 NVIDIA Triton 推理服務器旨在使性能模型部署過程盡可能簡單,它為在實際應用中嘗試部署 ML 算法時遇到的許多最常見問題提供了解決方案,包括:

多框架 支持 : 支持所有最常見的深度學習框架和序列化格式,包括 PyTorch 、 TensorFlow 、 ONNX 、 TensorRT 、 OpenVINO 等。隨著 FIL 后端的引入, NVIDIA Triton 推理服務器還提供對 XGBoost 、 LightGBM 、 Scikit Learn / cuML RandomForest 和任何框架中的 Treelite 序列化模型的支持。

Dynamic Batching : 允許用戶指定一個批處理窗口,并將在該窗口中收到的任何請求整理成更大的批處理,以優(yōu)化吞吐量。

多種查詢類型 :優(yōu)化多種查詢類型的推理:實時、批處理、流式,還支持模型集成。

使用 NVIDIA 管道和集合 推理服務器部署的 管道和集合 Triton 型號可以通過復雜的管道或集成進行連接,以避免客戶端和服務器之間,甚至主機和設備之間不必要的數(shù)據(jù)傳輸。

CPU 模型執(zhí)行 : 雖然大多數(shù)用戶希望利用 GPU 執(zhí)行帶來的巨大性能提升,但 NVIDIA Triton 推理服務器允許您在 CPU 或 GPU 上運行模型,以滿足您的特定部署需求和資源可用性。

Dynamic Batching [VZX337 ]如果NVIDIA Triton 推理服務器不提供對部分管道的支持,或者如果需要專門的邏輯將各種模型鏈接在一起,則可以使用自定義 PythonC++后端精確地添加所需的邏輯。

Run anywhere :在擴展的云或數(shù)據(jù)中心、企業(yè)邊緣,甚至在嵌入式設備上。它支持用于人工智能推理的裸機和虛擬化環(huán)境(如 VMware vSphere )。

Kubernetes 和 AI 平臺支持 :

作為 Docker 容器提供,并可輕松與 Kubernetes 平臺集成,如 AWS EKS 、谷歌 GKE 、 Azure AKS 、阿里巴巴 ACK 、騰訊 TKE 或紅帽 OpenShift 。

可在 Amazon SageMaker 、 Azure ML 、 Google Vertex AI 、阿里巴巴 AI 彈性算法服務平臺和騰訊 TI-EMS 等托管 CloudAI 工作流平臺上使用。

Enterprise support : NVIDIA AI 企業(yè)軟件套件包括對 NVIDIA Triton 推理服務器的全面支持,例如訪問 NVIDIA AI 專家以獲得部署和管理指導、安全修復和維護發(fā)布的優(yōu)先通知、長期支持( LTS )選項和指定的支持代理。

圖 1:NVIDIA Triton 推理服務器架構(gòu)圖。

為了更好地了解如何利用 FIL 后端的這些特性來部署樹模型,我們來看一個特定的用例。

示例: FIL 后端的欺詐檢測

為了在 NVIDIA Triton 推理服務器中部署模型,我們需要一個配置文件,指定有關(guān)部署選項和序列化模型本身的一些細節(jié)。模型當前可以按以下任意格式序列化:

XGBoost 二進制格式

XGBoost JSON

LightGBM 文本格式

Treelite 二進制檢查點文件

在下面的筆記本中,我們將介紹部署欺詐檢測模型過程的每個步驟,從培訓模型到編寫配置文件以及優(yōu)化部署參數(shù)。在此過程中,我們將演示 GPU 部署如何在保持最小延遲的同時顯著提高吞吐量。此外,由于 FIL 可以輕松地擴展到非常大和復雜的模型,而不會大幅增加延遲,因此我們將看到,對于任何給定的延遲預算,在 GPU 上部署比 CPU 上更復雜和準確的模型是可能的。

筆記本:

抱歉,出了點問題。 Reload?

抱歉,我們無法顯示此文件。

抱歉,此文件無效,無法顯示。

查看器需要 iframe 。

view raw正如我們在本筆記本中所看到的, NVIDIA Triton 推理服務器的 FIL 后端允許我們使用序列化的模型文件和簡單的配置文件輕松地為樹模型提供服務。如果沒有 NVIDIA Triton 推理服務器,那些希望服務于其他框架中的 XGBoost 、 LightGBM 或隨機林模型的人通常會求助于吞吐量延遲性能差且不支持多個框架的手動搖瓶服務器。 NVIDIA Triton 推理服務器的動態(tài)批處理和并發(fā)模型執(zhí)行自動最大化吞吐量,模型分析器有助于選擇最佳部署配置。手動選擇可能需要數(shù)百種組合,并且可能會延遲模型的展開。有了 FIL 后端,我們可以為來自所有這些框架的模型提供服務,而無需定制代碼和高度優(yōu)化的性能。

結(jié)論

使用 FIL 后端,NVIDIA Triton 推理服務器現(xiàn)在提供了一個高度優(yōu)化的實時服務的森林模型,無論是在他們自己或旁邊的深度學習模型。雖然支持 CPU 和 GPU 執(zhí)行,但我們可以利用 GPU 加速來保持低延遲和高吞吐量,即使對于復雜的模型也是如此。正如我們在示例筆記本中看到的,這意味著即使延遲預算很緊,也不需要通過退回到更簡單的模型來降低模型的準確性。

如果您想嘗試部署自己的 XGBOST 、 LITGBM 、 SKEXCEL 或 CUML 森林模型進行實時推理,那么您可以很容易地從 Docker container 、NVIDIA 的 GPU 優(yōu)化的 AI 軟件目錄中拉取 NVIDIA NVIDIA AI 企業(yè)套件 推理服務器 Docker container 。您可以在 FIL 后端文檔 中找到入門所需的一切。如果準備部署到 Kubernetes 集群, NVIDIA Triton 還提供了 Helm charts 示例。對于希望在實際工作負載下試用 Triton 推理服務器的企業(yè), NVIDIA LaunchPad 計劃提供了一組在 Triton 中使用 Triton 的精心策劃的實驗室。

Krieger 說:“ STAR 的獨特之處在于,它是第一個在軟組織中規(guī)劃、調(diào)整和執(zhí)行手術(shù)計劃的機器人系統(tǒng),只需極少的人工干預。”。

關(guān)于作者

William Hicks 是NVIDIA RAPIDS 團隊的高級軟件工程師。希克斯擁有布蘭代斯大學物理學碩士學位和布朗大學文學藝術(shù)碩士學位。

審核編輯:郭婷

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • NVIDIA
    +關(guān)注

    關(guān)注

    14

    文章

    5444

    瀏覽量

    108603
  • gpu
    gpu
    +關(guān)注

    關(guān)注

    28

    文章

    5050

    瀏覽量

    134031
  • 服務器
    +關(guān)注

    關(guān)注

    13

    文章

    10013

    瀏覽量

    90391
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    DeepSeek模型如何在云服務器上部署?

    隨著大型語言模型(LLM)的應用日益普及,許多開發(fā)者和企業(yè)希望將像DeepSeek這樣的優(yōu)秀模型部署到自己的云服務器上,以實現(xiàn)私有化、定制化服務并保障數(shù)據(jù)安全。本文將詳細闡述部署Dee
    的頭像 發(fā)表于 10-13 16:52 ?396次閱讀

    vision board部署模型到openmv的代碼導致連接超時怎么解決?

    在env終端中勾選了tiflte support后燒錄mdk到板子上后就開始顯示連接不到 無法部署模型
    發(fā)表于 09-19 07:59

    如何使用Docker部署模型

    隨著深度學習和大模型的快速發(fā)展,如何高效地部署這些模型成為了一個重要的挑戰(zhàn)。Docker 作為一種輕量級的容器化技術(shù),能夠?qū)?b class='flag-5'>模型及其依賴環(huán)境打包成一個可移植的容器,極大地簡化了
    的頭像 發(fā)表于 05-24 16:39 ?685次閱讀

    K230D部署模型失敗的原因?

    MicroPython部署的無法正常運行,采用C++版本的無法實現(xiàn)部署 嘗試解決過程 1.考慮到可能是固件不匹配的問題,重新燒錄了流程(生成模型后給的readme)中要求的固件,依舊無法成功
    發(fā)表于 03-11 06:19

    添越智創(chuàng)基于 RK3588 開發(fā)板部署測試 DeepSeek 模型全攻略

    DeepSeek 模型部署與測試,開啟這場充滿挑戰(zhàn)與驚喜的技術(shù)探索之旅。 RK3588 開發(fā)板:AI 性能擔當 RK3588 開發(fā)板基于先進的 8nm LP 制程工藝精心打造,其硬件配置堪稱豪華,在 AI
    發(fā)表于 02-14 17:42

    xgboost超參數(shù)調(diào)優(yōu)技巧 xgboost在圖像分類中的應用

    的成績。然而,XGBoost模型涉及眾多超參數(shù),這些參數(shù)的組合和調(diào)優(yōu)對于模型性能至關(guān)重要。以下是一些XGBoost超參數(shù)調(diào)優(yōu)的技巧: 理解主要超參數(shù) : 學習率(Learning Ra
    的頭像 發(fā)表于 01-31 15:16 ?1912次閱讀

    常見xgboost錯誤及解決方案

    XGBoost(eXtreme Gradient Boosting)是一種流行的機器學習算法,用于解決分類和回歸問題。盡管它非常強大和靈活,但在使用過程中可能會遇到一些常見的錯誤。以下是一些常見
    的頭像 發(fā)表于 01-19 11:22 ?4414次閱讀

    使用Python實現(xiàn)xgboost教程

    使用Python實現(xiàn)XGBoost模型通常涉及以下幾個步驟:數(shù)據(jù)準備、模型訓練、模型評估和模型預測。以下是一個詳細的教程,指導你如何在Pyt
    的頭像 發(fā)表于 01-19 11:21 ?2011次閱讀

    xgboost與LightGBM的優(yōu)勢對比

    在機器學習領(lǐng)域,集成學習算法因其出色的性能和泛化能力而受到廣泛關(guān)注。其中,XGBoost和LightGBM是兩種非常流行的梯度提升框架。 1. 算法基礎(chǔ) XGBoost(eXtreme
    的頭像 發(fā)表于 01-19 11:18 ?1873次閱讀

    xgboost的并行計算原理

    之一。 XGBoost簡介 XGBoost是一種基于梯度提升框架的集成學習算法,它通過構(gòu)建多個決策樹來提高模型的預測性能。與傳統(tǒng)的梯度提升樹相比,XGBoost在算法上進行了優(yōu)化,包括
    的頭像 發(fā)表于 01-19 11:17 ?1441次閱讀

    xgboost在圖像分類中的應用

    XGBoost(eXtreme Gradient Boosting)是一種高效的機器學習算法,它基于梯度提升框架,通過構(gòu)建多個弱學習器(通常是決策樹)來提高模型的性能。XGBoost因其出色的性能
    的頭像 發(fā)表于 01-19 11:16 ?1397次閱讀

    企業(yè)AI模型部署攻略

    當下,越來越多的企業(yè)開始探索和實施AI模型,以提升業(yè)務效率和競爭力。然而,AI模型部署并非易事,需要企業(yè)在多個層面進行細致的規(guī)劃和準備。下面,AI部落小編為企業(yè)提供一份AI模型
    的頭像 發(fā)表于 12-23 10:31 ?1081次閱讀

    AI模型部署邊緣設備的奇妙之旅:目標檢測模型

    以及邊緣計算能力的增強,越來越多的目標檢測應用開始直接在靠近數(shù)據(jù)源的邊緣設備上運行。這不僅減少了數(shù)據(jù)傳輸延遲,保護了用戶隱私,同時也減輕了云端服務器的壓力。然而,在邊緣端部署高效且準確的目標檢測模型
    發(fā)表于 12-19 14:33

    如何開啟Stable Diffusion WebUI模型推理部署

    如何開啟Stable Diffusion WebUI模型推理部署
    的頭像 發(fā)表于 12-11 20:13 ?1036次閱讀
    如何開啟Stable Diffusion WebUI<b class='flag-5'>模型</b>推理<b class='flag-5'>部署</b>

    企業(yè)AI模型部署怎么做

    AI模型部署作為這一轉(zhuǎn)型過程中的關(guān)鍵環(huán)節(jié),其成功實施對于企業(yè)的長遠發(fā)展至關(guān)重要。在此,AI部落小編為您介紹企業(yè)AI模型部署的步驟以及注意事項。
    的頭像 發(fā)表于 11-04 10:15 ?1098次閱讀