chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

NVIDIA NIM助力企業(yè)高效部署生成式AI模型

NVIDIA英偉達(dá)企業(yè)解決方案 ? 來源:NVIDIA英偉達(dá)企業(yè)解決方案 ? 2024-10-10 09:49 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

Canonical、Nutanix 和 Red Hat 等廠商的開源 Kubernetes 平臺集成了 NVIDIA NIM,將允許用戶通過 API 調(diào)用來大規(guī)模地部署大語言模型。

在企業(yè)中部署生成式 AI 將變得空前簡單。

NVIDIA NIM是一套生成式 AI 推理微服務(wù),將支持 KServe 開源軟件,可以自動將 AI 模型以云計算應(yīng)用的規(guī)模運行。

NVIDIA NIM 與 KServe 的組合確保了生成式 AI 可以像任何其他大型企業(yè)級應(yīng)用一樣進行部署,還讓用戶能夠通過 Canonical、Nutanix 和 Red Hat 等數(shù)十家公司的平臺廣泛使用 NIM。

NIM 在 KServe 上的集成將使 NVIDIA 的技術(shù)擴展到開源社區(qū)、生態(tài)系統(tǒng)合作伙伴和客戶。借助 NIM,他們可以通過 API 調(diào)用(即現(xiàn)代編程的一鍵式操作)來獲得NVIDIA AI Enterprise軟件平臺的性能、支持和安全性。

在 Kubernetes 上提供 AI

KServe 最初是基于 Kubernetes 的機器學(xué)習(xí)工具包 Kubeflow 的一部分。Kubernete 是一個開源系統(tǒng),用于部署和管理包含大型分布式應(yīng)用組件的軟件容器。

隨著 Kubeflow 在 AI 推理方面的不斷擴展,KServe 誕生了,并最終演變成為獨立的開源項目。

許多公司都為 KServe 軟件做出了貢獻(xiàn)并采用了該軟件。目前,運行 KServe 軟件的公司包括亞馬遜科技、彭博、Canonical、思科、慧與、IBM、Red Hat、Zillow 和 NVIDIA 等。

深入解析 KServe

KServe 本質(zhì)上是 Kubernetes 的擴展,它像一個強大的云應(yīng)用一樣運行 AI 推理。它使用標(biāo)準(zhǔn)協(xié)議,以經(jīng)過優(yōu)化的性能運行,并支持 PyTorch、Scikit-learn、TensorFlow 和 XGBoost,而用戶無需了解這些 AI 框架的細(xì)節(jié)。

在新的大語言模型(LLM)層出不窮的情況下,該軟件尤其有用。

KServe 讓用戶可以輕松地在模型之間來回切換,測試哪一個最符合他們的需求。當(dāng)模型的新版本發(fā)布時,KServe 的 “金絲雀發(fā)布(canary rollouts)” 功能會自動執(zhí)行詳細(xì)驗證,并逐步將其部署到生產(chǎn)系統(tǒng)中。

其另一項功能 “GPU 自動縮放” 可以隨著服務(wù)需求的起伏來高效地管理模型的部署方式,從而使客戶和服務(wù)提供商獲得最佳體驗。

生成式 AI 的 API 調(diào)用

KServe 的優(yōu)勢現(xiàn)在將通過 NVIDIA NIM 的便捷性提供。

使用 NIM ,只需一個簡單的 API 調(diào)用即可應(yīng)對所有的復(fù)雜性。企業(yè) IT 管理員能夠獲得確保應(yīng)用以最佳性能和效率運行所需的指標(biāo),無論應(yīng)用是在他們的數(shù)據(jù)中心還是在遠(yuǎn)程云服務(wù)上,即使是在更改了 AI 模型的情況下。

NIM 讓 IT 專家成為生成式 AI 專家,變革了公司的運營。這就是為什么 Foxconn 和 ServiceNow 等眾多企業(yè)都正在部署 NIM 微服務(wù)的原因。

NIM 支持?jǐn)?shù)十個 Kubernetes 平臺

由于 NIM 與 KServe 的集成,用戶將能夠在數(shù)十個企業(yè)平臺上訪問 NIM,比如 Canonical 的 Charmed KubeFlow 和 Charmed Kubernetes、Nutanix GPT-in-a-Box 2.0、Red Hat 的 OpenShift AI 等等。

KServe 貢獻(xiàn)者、Red Hat 首席軟件工程師 Yuan Tang 表示:“Red Hat 一直在與 NVIDIA 合作,以便讓企業(yè)更輕松地使用開源技術(shù)來部署 AI。通過增強 KServe 并在 Red Hat OpenShift AI 中增加對 NIM 的支持,我們能夠讓 Red Hat 的客戶更方便地訪問 NVIDIA 的生成式 AI 平臺?!?/p>

“通過將 NVIDIA NIM 推理微服務(wù)與 Nutanix GPT-in-a-Box 2.0 集成,客戶將能夠從云端到邊緣以一致的方式去構(gòu)建可擴展、安全、高性能的生成式 AI 應(yīng)用?!?Nutanix 工程副總裁 Debojyoti Dutta 表示,其團隊為 KServe 和 Kubeflow 做出了貢獻(xiàn)。

Canonical 的 MLOps 產(chǎn)品經(jīng)理 Andreea Munteanu 表示:“作為一家對 KServe 做出重大貢獻(xiàn)的公司,我們很高興通過 Charmed Kubernetes 和 Charmed Kubeflow 提供 NIM。在我們的共同努力下,用戶將能夠輕松地使用生成式 AI 的全部功能,并使其保持最高的性能和效率?!?/p>

數(shù)十家其他軟件提供商都能感受到 NIM 的好處,因為他們的產(chǎn)品中也包含了 KServe。

服務(wù)開源社區(qū)

NVIDIA 一直積極地參與 KServe 項目。正如最近的一篇技術(shù)博客中所提到的,KServe 的開放推理協(xié)議已經(jīng)被用于NVIDIA Triton 推理服務(wù)器,可以幫助用戶跨多個 GPU、框架和操作模式同時運行許多 AI 模型。

基于 KServe,NVIDIA 專注于在多個 GPU 上一次運行一個 AI 模型的用例。

作為 NIM 集成的一部分,NVIDIA 計劃在其開源軟件(包括 Triton 和TensorRT-LLM)的基礎(chǔ)上,成為 KServe 的積極貢獻(xiàn)者。NVIDIA 還是云原生計算基金會(CNCF)的活躍成員,該基金會支持生成式 AI 和其他項目的開源代碼。

立即通過 NVIDIA API 目錄試用 Llama 3 8B 或 Llama 3 70B 大語言模型的 NIM API。全球數(shù)百家 NVIDIA 合作伙伴也正在使用 NIM 來部署生成式 AI。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • NVIDIA
    +關(guān)注

    關(guān)注

    14

    文章

    5309

    瀏覽量

    106433
  • 數(shù)據(jù)中心
    +關(guān)注

    關(guān)注

    16

    文章

    5230

    瀏覽量

    73530
  • AI
    AI
    +關(guān)注

    關(guān)注

    88

    文章

    35164

    瀏覽量

    280060

原文標(biāo)題:COMPUTEX 2024 | KServe 提供商在云和數(shù)據(jù)中心提供由 NIM 賦能的推理

文章出處:【微信號:NVIDIA-Enterprise,微信公眾號:NVIDIA英偉達(dá)企業(yè)解決方案】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    英偉達(dá)GTC2025亮點:Oracle與NVIDIA合作助力企業(yè)加速代理式AI推理

    基礎(chǔ)設(shè)施以及生成 AI 服務(wù)首次實現(xiàn)集成,以幫助全球企業(yè)組織加速創(chuàng)建代理式 AI 應(yīng)用。 此次 Oracle Cloud Infrast
    的頭像 發(fā)表于 03-21 12:01 ?704次閱讀
    英偉達(dá)GTC2025亮點:Oracle與<b class='flag-5'>NVIDIA</b>合作<b class='flag-5'>助力</b><b class='flag-5'>企業(yè)</b>加速代理式<b class='flag-5'>AI</b>推理

    聚云科技榮獲亞馬遜云科技生成AI能力認(rèn)證 助力企業(yè)加速生成AI應(yīng)用落地

    、數(shù)據(jù)處理、模型調(diào)優(yōu)到應(yīng)用集成與部署等方面,助力企業(yè)加速生成
    發(fā)表于 02-14 13:41 ?152次閱讀

    NVIDIA 發(fā)布保障代理式 AI 應(yīng)用安全的 NIM 微服務(wù)

    務(wù)是 NVIDIA NeMo Guardrails 軟件工具系列的一部分。這些可移植且經(jīng)過優(yōu)化的推理微服務(wù)可幫助企業(yè)提高生成 AI 應(yīng)用的
    發(fā)表于 01-17 16:29 ?161次閱讀

    NVIDIA推出多個生成AI模型和藍(lán)圖

    NVIDIA 宣布推出多個生成 AI 模型和藍(lán)圖,將 NVIDIA Omniverse 一體化
    的頭像 發(fā)表于 01-08 10:48 ?636次閱讀

    NVIDIA推出全新生成AI模型Fugatto

    NVIDIA 開發(fā)了一個全新的生成 AI 模型。利用輸入的文本和音頻,該模型可以創(chuàng)作出包含任意
    的頭像 發(fā)表于 11-27 11:29 ?822次閱讀

    全新NVIDIA NIM微服務(wù)實現(xiàn)突破性進展

    全新 NVIDIA NIM 微服務(wù)實現(xiàn)突破性進展,可助力氣象技術(shù)公司開發(fā)和部署 AI 模型,實現(xiàn)
    的頭像 發(fā)表于 11-21 10:07 ?675次閱讀

    NVIDIA助力企業(yè)創(chuàng)建定制AI應(yīng)用

    NVIDIA 近日宣布與眾多技術(shù)領(lǐng)導(dǎo)者一同使用最新NVIDIA NIM Agent Blueprint以及NVIDIA NeMo和NVIDIA
    的頭像 發(fā)表于 11-20 09:12 ?728次閱讀

    NVIDIA助力Amdocs打造生成AI智能體

    正在使用NVIDIA DGX Cloud 與 NVIDIA AI Enterprise軟件開發(fā)和交付基于商用大語言模型(LLM)和領(lǐng)域適配模型
    的頭像 發(fā)表于 11-19 14:48 ?912次閱讀

    NVIDIA 攜手全球合作伙伴推出 NIM Agent Blueprints,助力企業(yè)打造屬于自己的 AI

    可定制工作流目錄加快核心生成 AI 用例的部署速度。首批用例包括客戶服務(wù)、藥物研發(fā)和 PDF 數(shù)據(jù)提取,未來將加入更多用例 企業(yè)可以使用
    發(fā)表于 08-28 10:10 ?387次閱讀
    <b class='flag-5'>NVIDIA</b> 攜手全球合作伙伴推出 <b class='flag-5'>NIM</b> Agent Blueprints,<b class='flag-5'>助力</b><b class='flag-5'>企業(yè)</b>打造屬于自己的 <b class='flag-5'>AI</b>

    借助NVIDIA NIM加速AI應(yīng)用部署

    大語言模型(LLM)在企業(yè)組織中的應(yīng)用日益廣泛,許多企業(yè)都將其整合到 AI 應(yīng)用中。雖然從基礎(chǔ)模型著手十分
    的頭像 發(fā)表于 08-23 16:38 ?771次閱讀
    借助<b class='flag-5'>NVIDIA</b> <b class='flag-5'>NIM</b>加速<b class='flag-5'>AI</b>應(yīng)用<b class='flag-5'>部署</b>

    全新NVIDIA NIM微服務(wù)將生成AI引入數(shù)字環(huán)境

    生成物理 AI NIM 微服務(wù)以及 NVIDIA Metropolis 參考工作流旨在協(xié)助創(chuàng)建智能的沉浸
    的頭像 發(fā)表于 08-02 15:20 ?930次閱讀

    NVIDIA NIM:打造AI領(lǐng)域的AI-in-a-Box,提高AI開發(fā)與部署高效

    據(jù)7月30日官方發(fā)布的資訊顯示,在全球備受矚目的計算機圖形學(xué)盛會——SIGGRAPH 2024上,NVIDIA公司對外展示了其在諸如渲染、仿真及生成AI等前沿領(lǐng)域所取得的卓越成果,而
    的頭像 發(fā)表于 07-30 16:27 ?1142次閱讀

    NVIDIA攜手Meta推出AI服務(wù),為企業(yè)提供生成AI服務(wù)

    NVIDIA近日宣布了一項重大舉措,正式推出NVIDIA AI Foundry服務(wù)與NVIDIA NIM
    的頭像 發(fā)表于 07-25 16:57 ?849次閱讀

    英偉達(dá)推出全新NVIDIA AI Foundry服務(wù)和NVIDIA NIM推理微服務(wù)

    NVIDIA 宣布推出全新 NVIDIA AI Foundry 服務(wù)和 NVIDIA NIM 推理微服務(wù),與同樣剛推出的 Llama 3.1
    的頭像 發(fā)表于 07-25 09:48 ?1063次閱讀

    NVIDIA AI Foundry 為全球企業(yè)打造自定義 Llama 3.1 生成 AI 模型

    Foundry 提供從數(shù)據(jù)策管、合成數(shù)據(jù)生成、微調(diào)、檢索、防護到評估的全方位生成 AI 模型服務(wù),以便
    發(fā)表于 07-24 09:39 ?920次閱讀
    <b class='flag-5'>NVIDIA</b> <b class='flag-5'>AI</b> Foundry 為全球<b class='flag-5'>企業(yè)</b>打造自定義 Llama 3.1 <b class='flag-5'>生成</b><b class='flag-5'>式</b> <b class='flag-5'>AI</b> <b class='flag-5'>模型</b>