Cadence、Dropbox、SAP、ServiceNow 率先使用 NVIDIA NeMo Retriever 優(yōu)化語義檢索,實現(xiàn)準(zhǔn)確的 AI 推理
NVIDIA 今日宣布推出一項生成式 AI 微服務(wù),支持企業(yè)將自定義大語言模型與企業(yè)數(shù)據(jù)相連接,使其 AI 應(yīng)用能夠提供高度準(zhǔn)確的響應(yīng)。
NVIDIA NeMo Retriever 是 NVIDIA NeMo(一個用于構(gòu)建、自定義和部署生成式 AI 模型的框架和工具系列)的一項全新服務(wù),通過企業(yè)級檢索增強生成(RAG)功能,幫助組織加強其生成式 AI 應(yīng)用。
作為一項語義檢索微服務(wù),NeMo Retriever 借助經(jīng) NVIDIA 優(yōu)化的算法,幫助生成式 AI 應(yīng)用作出更加準(zhǔn)確的回答。使用該微服務(wù)的開發(fā)者,可以將其 AI 應(yīng)用與位于各個云和數(shù)據(jù)中心的業(yè)務(wù)數(shù)據(jù)相連通。該服務(wù)為 AI 代工添加了 NVIDIA 優(yōu)化的 RAG 功能,并被整合到亞馬遜云科技 Marketplace 上的 NVIDIA AI Enterprise 軟件平臺中。
Cadence、Dropbox、SAP 和 ServiceNow 等公司已率先與 NVIDIA 合作,將生產(chǎn)就緒型 RAG 功能整合至其自定義生成式 AI 應(yīng)用和服務(wù)中。
NVIDIA 創(chuàng)始人兼首席執(zhí)行官黃仁勛表示:“具有 RAG 功能的生成式 AI 應(yīng)用是企業(yè)的下一個殺手級應(yīng)用。借助 NVIDIA NeMo Retriever,開發(fā)者可以創(chuàng)建自定義生成式 AI 聊天機器人、AI 助手和摘要工具。它們能夠訪問企業(yè)的業(yè)務(wù)數(shù)據(jù),通過準(zhǔn)確且有價值的生成式 AI 智能來提高生產(chǎn)力?!?/p>
全球頭部企業(yè)借助 NeMo Retriever
提高大語言模型(LLM)準(zhǔn)確性
電子系統(tǒng)設(shè)計領(lǐng)導(dǎo)廠商 Cadence 為超大規(guī)模計算、5G 通信、汽車、移動、航空航天、消費和醫(yī)療市場的企業(yè)提供服務(wù)。該公司正與 NVIDIA 合作,為工業(yè)電子設(shè)計領(lǐng)域的生成式 AI 應(yīng)用開發(fā) RAG 功能。
Cadence 總裁兼首席執(zhí)行官 Anirudh Devgan 表示:“生成式 AI 引入了創(chuàng)新方法來滿足客戶需求,比如能在設(shè)計流程早期發(fā)現(xiàn)潛在缺陷的工具等。我們的研究人員正在與 NVIDIA 合作,使用 NeMo Retriever 進(jìn)一步提高生成式 AI 應(yīng)用的準(zhǔn)確性和相關(guān)性,以便發(fā)現(xiàn)問題,并幫助客戶更快地將優(yōu)質(zhì)產(chǎn)品推向市場?!?/p>
破解精確的生成式 AI 應(yīng)用的“密碼”
與開源 RAG 工具套件不同,NeMo Retriever 是通過具有商業(yè)可行性的模型、API 穩(wěn)定性、安全補丁和企業(yè)級支持,來為生產(chǎn)就緒型生成式 AI 賦能。
經(jīng) NVIDIA 優(yōu)化的算法使 Retriever 的嵌入模型能夠產(chǎn)出準(zhǔn)確性最高的結(jié)果。經(jīng)過優(yōu)化的嵌入模型能夠捕捉單詞之間的關(guān)系,使 LLM 能夠處理和分析文本數(shù)據(jù)。
企業(yè)可以使用 NeMo Retriever 將 LLM 連接到多個數(shù)據(jù)源和知識庫,這樣用戶就可以輕松地與數(shù)據(jù)交互,并通過簡單的對話指令獲得準(zhǔn)確且最新的答案。通過使用由 Retriever 驅(qū)動的應(yīng)用,企業(yè)可以使用戶安全地訪問多種數(shù)據(jù)格式的信息,如文本、PDF、圖像和視頻等。
借助 NeMo Retriever,企業(yè)能夠以更少的訓(xùn)練獲得更準(zhǔn)確的結(jié)果,加快產(chǎn)品上市時間,并減少生成式 AI 應(yīng)用開發(fā)產(chǎn)生的能耗。
通過 NVIDIA AI Enterprise 實現(xiàn)
可靠、簡單且安全的部署
企業(yè)可以在幾乎任何數(shù)據(jù)中心或云端的 NVIDIA 加速計算上部署由 NeMo Retriever 驅(qū)動的應(yīng)用,以便在推理過程中運行。NVIDIA AI Enterprise 可支持通過 NVIDIA Triton 推理服務(wù)器、NVIDIA TensorRT、NVIDIA TensorRT-LLM 及其他 NVIDIA AI 軟件進(jìn)行加速的高性能推理。
供應(yīng)情況
開發(fā)者可以注冊并搶先體驗 NVIDIA NeMo Retriever:https://developer.nvidia.com/nemo-microservices-early-access
GTC 2024 將于 2024 年 3 月 18 至 21 日在美國加州圣何塞會議中心舉行,線上大會也將同期開放。點擊“閱讀原文”或掃描下方海報二維碼,立即注冊 GTC 大會。
原文標(biāo)題:NVIDIA 通過企業(yè)級生成式 AI 微服務(wù)為聊天機器人、AI 助手和摘要工具帶來商業(yè)智能
文章出處:【微信公眾號:NVIDIA英偉達(dá)企業(yè)解決方案】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
-
英偉達(dá)
+關(guān)注
關(guān)注
22文章
3950瀏覽量
93721
原文標(biāo)題:NVIDIA 通過企業(yè)級生成式 AI 微服務(wù)為聊天機器人、AI 助手和摘要工具帶來商業(yè)智能
文章出處:【微信號:NVIDIA-Enterprise,微信公眾號:NVIDIA英偉達(dá)企業(yè)解決方案】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
發(fā)布評論請先 登錄
NVIDIA RTX AI PC為AnythingLLM加速本地AI工作流
企業(yè)使用NVIDIA NeMo微服務(wù)構(gòu)建AI智能體平臺
Microchip推出MPLAB AI編碼助手
NVIDIA 發(fā)布保障代理式 AI 應(yīng)用安全的 NIM 微服務(wù)
NVIDIA推出多個生成式AI模型和藍(lán)圖
Cloudera推出RAG Studio,助力企業(yè)快速部署聊天機器人
NLP技術(shù)在聊天機器人中的作用
ChatGPT 與傳統(tǒng)聊天機器人的比較
NVIDIA與思科合作打造企業(yè)級生成式AI基礎(chǔ)設(shè)施
Meta將推出音頻版聊天機器人
全新NVIDIA NIM微服務(wù)將生成式AI引入數(shù)字環(huán)境
Meta關(guān)閉明星AI聊天機器人,轉(zhuǎn)向用戶自創(chuàng)AI工具
NVIDIA攜手Meta推出AI服務(wù),為企業(yè)提供生成式AI服務(wù)
英偉達(dá)推出全新NVIDIA AI Foundry服務(wù)和NVIDIA NIM推理微服務(wù)
NVIDIA AI Foundry 為全球企業(yè)打造自定義 Llama 3.1 生成式 AI 模型

評論