NVIDIA推出用于大型語(yǔ)言模型和生成式AI工作負(fù)載的推理平臺(tái)

谷歌云、D-ID、Cohere將新平臺(tái)用于各種生成式AI服務(wù)，包括聊天機(jī)器人、文本生成圖像內(nèi)容、AI視頻等。
?

?
加利福尼亞州圣克拉拉 -? GTC - 太平洋時(shí)間2023年3月21日 – NVIDIA于今日推出四款推理平臺(tái)。這些平臺(tái)針對(duì)各種快速興起的生成式AI應(yīng)用進(jìn)行了優(yōu)化，能夠幫助開發(fā)人員快速構(gòu)建用于提供新服務(wù)和洞察的AI驅(qū)動(dòng)的專業(yè)應(yīng)用。
?
這些平臺(tái)將NVIDIA的全棧推理軟件與最新的NVIDIA Ada、Hopper和Grace Hopper處理器相結(jié)合，包括今天推出的NVIDIA L4 Tensor Core GPU和NVIDIA H100 NVL GPU。各平臺(tái)針對(duì)AI視頻、圖像生成、大型語(yǔ)言模型部署、推薦系統(tǒng)推理等需求激增的工作負(fù)載進(jìn)行了優(yōu)化。
?
NVIDIA創(chuàng)始人兼首席執(zhí)行官黃仁勛表示：“生成式AI的興起需要更加強(qiáng)大的推理計(jì)算平臺(tái)。生成式AI應(yīng)用的數(shù)量是無(wú)限的，它唯一的限制就是人類的想象力。為開發(fā)人員提供最強(qiáng)大、靈活的推理計(jì)算平臺(tái)將加快新服務(wù)的創(chuàng)造速度，這些新服務(wù)將以前所未有的方式改善我們的生活?！?br /> ?
加速生成式AI的各種推理工作負(fù)載集

每個(gè)平臺(tái)都包含一個(gè)為特定生成式AI推理工作負(fù)載而優(yōu)化的NVIDIA GPU和專用的軟件：
?

適用于AI視頻的NVIDIA L4可提供比CPU高出120倍的AI視頻性能，同時(shí)能效提高了99%。這款適用于幾乎所有工作負(fù)載的通用GPU提供更加強(qiáng)大的視頻解碼和轉(zhuǎn)碼能力、視頻流式傳輸、增強(qiáng)現(xiàn)實(shí)、生成式AI視頻等。

適用于圖像生成的NVIDIA L40針對(duì)圖形以及AI支持的2D、視頻和3D圖像生成進(jìn)行了優(yōu)化。L40平臺(tái)是NVIDIA Omniverse?（一個(gè)用于在數(shù)據(jù)中心構(gòu)建和運(yùn)行元宇宙應(yīng)用的平臺(tái)）的引擎，與上一代產(chǎn)品相比，其Stable Diffusion推理性能提高了7倍，Omniverse性能提高了12倍。

適用于大型語(yǔ)言模型部署的NVIDIA H100 NVL是規(guī)?；渴鹣馛hatGPT這樣的大型語(yǔ)言模型（LLMs）的理想平臺(tái)。這款新的H100 NVL擁有94GB內(nèi)存和Transformer引擎加速，在數(shù)據(jù)中心規(guī)模，與上一代A100相比，GPT-3上的推理性能提高了多達(dá)12倍。

適用于推薦模型的NVIDIA Grace Hopper是圖形推薦模型、矢量數(shù)據(jù)庫(kù)和圖神經(jīng)網(wǎng)絡(luò)的理想平臺(tái)。通過NVLink-C2C以900 GB/s 的速度連接CPU和GPU，Grace Hopper的數(shù)據(jù)傳輸和查詢速度比PCIe 5.0快了7倍。

?
這些平臺(tái)的軟件層采用NVIDIA AI Enterprise軟件套件，包括用于高性能深度學(xué)習(xí)推理的軟件開發(fā)套件NVIDIA TensorRT?，以及幫助實(shí)現(xiàn)模型部署標(biāo)準(zhǔn)化的開源推理服務(wù)軟件NVIDIA Triton Inference Server?。
?
早期采用者與支持

谷歌云是NVIDIA推理平臺(tái)的重要云合作伙伴和早期客戶。該公司正在將L4平臺(tái)整合到其機(jī)器學(xué)習(xí)平臺(tái)Vertex AI中，并且是第一家提供L4實(shí)例的云服務(wù)提供商，其G2虛擬機(jī)的私人預(yù)覽版已于今天推出。
?
NVIDIA和谷歌今天分別宣布了首批在谷歌云上使用L4的兩家機(jī)構(gòu)——Descript和WOMBO，前者使用生成式AI幫助創(chuàng)作者制作視頻和播客，后者提供“Dream”這一AI驅(qū)動(dòng)的文本-數(shù)字藝術(shù)轉(zhuǎn)換應(yīng)用程序。
?
另一個(gè)早期采用者快手提供了一個(gè)短視頻應(yīng)用程序，利用GPU對(duì)傳入的實(shí)時(shí)流媒體視頻進(jìn)行解碼、捕捉關(guān)鍵幀并優(yōu)化音視頻。然后，它使用一個(gè)基于Transformer的大型模型理解多模態(tài)內(nèi)容，從而提高全球數(shù)億用戶的點(diǎn)擊率。
?
快手高級(jí)副總裁于越表示：“快手推薦系統(tǒng)所服務(wù)的社區(qū)每天的用戶人數(shù)超過3.6億，他們每天貢獻(xiàn)3000萬(wàn)條UGC視頻。在相同的總體擁有成本下，相較于CPU，NVIDIA GPU將系統(tǒng)的端到端吞吐量提高了11倍，將延遲降低了20%。”
?
領(lǐng)先的生成式AI技術(shù)平臺(tái)D-ID，通過使用NVIDIA L40 GPU從文本中生成逼真的數(shù)字人，支持任何內(nèi)容來(lái)生成人臉，不僅幫助專業(yè)人士改進(jìn)視頻內(nèi)容，同時(shí)減少了大規(guī)模視頻制作的成本和麻煩。
?
D-ID研發(fā)副總裁Or Gorodissky表示：“L40的性能十分驚人。有了它，我們將推理速度提高了一倍。D-ID十分高興能夠?qū)⑦@個(gè)新硬件作為我們產(chǎn)品的一部分，以前所未有的性能和分辨率實(shí)現(xiàn)AI人的實(shí)時(shí)流傳輸，并降低我們的計(jì)算成本?！?br /> ?
領(lǐng)先的AI制作工作室Seyhan Lee使用生成式AI為電影、廣播和娛樂行業(yè)開發(fā)沉浸式體驗(yàn)和迷人的創(chuàng)意內(nèi)容。
?
Seyhan Lee聯(lián)合創(chuàng)始人Pinar Demirdag表示：“L40 GPU為我們的生成式AI應(yīng)用帶來(lái)了驚人的性能提升。憑借L40的推理能力和內(nèi)存容量，我們可以部署非常先進(jìn)的模型，并以驚人的速度和精度向客戶提供創(chuàng)新的服務(wù)?！?br /> ?
語(yǔ)言AI領(lǐng)域的先鋒Cohere所運(yùn)行的平臺(tái)使得開發(fā)人員能夠在保護(hù)數(shù)據(jù)隱私和安全的情況下，構(gòu)建自然語(yǔ)言模型。
?
Cohere首席執(zhí)行官Aidan Gomez表示：“憑借NVIDIA的全新高性能H100推理平臺(tái)，我們可以使用先進(jìn)的生成式模型為客戶提供更加優(yōu)質(zhì)、高效的服務(wù)，推動(dòng)對(duì)話式AI、多語(yǔ)言企業(yè)搜索、信息提取等各種NLP應(yīng)用的發(fā)展?！?br /> ?
供應(yīng)情況
NVIDIA L4 GPU私人預(yù)覽版現(xiàn)已通過谷歌云平臺(tái)以及30多家計(jì)算機(jī)制造商所組成的全球網(wǎng)絡(luò)提供。
?
NVIDIA L40 GPU現(xiàn)已通過全球領(lǐng)先的系統(tǒng)提供商提供，并且合作伙伴平臺(tái)的數(shù)量將在今年持續(xù)增加。
?
Grace Hopper超級(jí)芯片已開始樣品供貨，預(yù)計(jì)下半年將全面投產(chǎn)。H100 NVL GPU也將于下半年面市。
?
NVIDIA AI Enterprise現(xiàn)在通過各大云市場(chǎng)以及數(shù)十家系統(tǒng)提供商和合作伙伴提供。NVIDIA AI Enterprise為客戶提供NVIDIA 企業(yè)級(jí)支持、定期安全審查以及NVIDIA Triton Inference Server?、TensorRT?和50多個(gè)預(yù)訓(xùn)練模型與框架的API穩(wěn)定性。
?
NVIDIA LaunchPad上免費(fèi)提供的動(dòng)手實(shí)驗(yàn)室可以試用用于生成式AI的NVIDIA推理平臺(tái)。樣品實(shí)驗(yàn)室的內(nèi)容包括訓(xùn)練和部署一個(gè)客服聊天機(jī)器人、部署一個(gè)端到端AI工作負(fù)載、在H100上調(diào)整和部署一個(gè)語(yǔ)言模型以及使用NVIDIA Triton部署一個(gè)欺詐檢測(cè)模型。
?

閱讀全文

NVIDIA(109324) NVIDIA(109324)
AI(298911) AI(298911)
生成式AI(1051) 生成式AI(1051)

評(píng)論

大型語(yǔ)言模型的邏輯推理能力探究

最新研究揭示，盡管大語(yǔ)言模型LLMs在語(yǔ)言理解上表現(xiàn)出色，但在邏輯推理方面仍有待提高。為此，研究者們推出了GLoRE，一個(gè)全新的邏輯推理評(píng)估基準(zhǔn)，包含12個(gè)數(shù)據(jù)集，覆蓋三大任務(wù)類型。

2023-11-23 15:05:16

2019

NVIDIA 借助超大規(guī)模 AI 語(yǔ)言模型為全球企業(yè)賦能

NVIDIA NeMo Megatron 框架; 可定制的大規(guī)模語(yǔ)言模型 Megatron 530B；多GPU、多節(jié)點(diǎn) Triton推理服務(wù)器助力基于語(yǔ)言的AI開發(fā)和部署，推動(dòng)行業(yè)和科學(xué)發(fā)展。

2021-11-10 14:22:52

1160

NVIDIA 推出大型語(yǔ)言模型云服務(wù)以推進(jìn) AI 和數(shù)字生物學(xué)的發(fā)展

NVIDIA NeMo 大型語(yǔ)言模型（LLM）服務(wù)幫助開發(fā)者定制大規(guī)模語(yǔ)言模型；NVIDIA BioNeMo 服務(wù)幫助研究人員生成和預(yù)測(cè)分子、蛋白質(zhì)及 DNA ? 美國(guó)加利福尼亞州圣克拉拉

2022-09-21 15:24:52

737

NVIDIA推出DGX GH200 AI超級(jí)計(jì)算機(jī)

驅(qū)動(dòng)的NVIDIA DGX?超級(jí)計(jì)算機(jī)，旨在助力開發(fā)面向生成式AI語(yǔ)言應(yīng)用、推薦系統(tǒng)和數(shù)據(jù)分析工作負(fù)載的巨型、下一代模型。 ? NVIDIA DGX GH200的超大共享內(nèi)存空間通過NVLink互連技術(shù)以及NVLink

2023-05-30 14:15:36

1010

NVIDIA AI Foundry 為全球企業(yè)打造自定義 Llama 3.1 生成式 AI 模型

Foundry 提供從數(shù)據(jù)策管、合成數(shù)據(jù)生成、微調(diào)、檢索、防護(hù)到評(píng)估的全方位生成式 AI 模型服務(wù)，以便部署自定義 Llama 3.1 NVIDIA NIM 微服務(wù)和新的 NVIDIA NeMo

2024-07-24 09:39:45

1105

NVIDIA 推出高性價(jià)比的生成式 AI 超級(jí)計(jì)算機(jī)

Jetson Orin Nano Super 可將生成式 AI 性能提升至1.7 倍，支持科技愛好者、開發(fā)者和學(xué)生使用的主流模型。 ? ? NVIDIA 推出了一款全新的尺寸小巧的生成式 AI 超級(jí)

2024-12-18 17:01:32

971

NVIDIA 在首個(gè)AI推理基準(zhǔn)測(cè)試中大放異彩

的BERT、GNMT 和Jasper 等AI模型開源優(yōu)化幫助開發(fā)者實(shí)現(xiàn)頂尖推理性能。NVIDIA的客戶和合作伙伴中包括有會(huì)話式AI領(lǐng)域的一流公司，比如Kensho、微軟、Nuance、Optum等。最后要

2019-11-08 19:44:51

【大語(yǔ)言模型：原理與工程實(shí)踐】大語(yǔ)言模型的應(yīng)用

，它通過抽象思考和邏輯推理，協(xié)助我們應(yīng)對(duì)復(fù)雜的決策。相應(yīng)地，我們?cè)O(shè)計(jì)了兩類任務(wù)來(lái)檢驗(yàn)大語(yǔ)言模型的能力。一類是感性的、無(wú)需理性能力的任務(wù)，類似于人類的系統(tǒng)1，如情感分析和抽取式問答等。大語(yǔ)言模型在這

2024-05-07 17:21:45

【大語(yǔ)言模型：原理與工程實(shí)踐】揭開大語(yǔ)言模型的面紗

。這一過程的不斷迭代使大語(yǔ)言模型的語(yǔ)言理解和生成能力逐步提升。大語(yǔ)言模型在自然語(yǔ)言處理領(lǐng)域應(yīng)用廣泛，尤其在問答系統(tǒng)和機(jī)器翻譯方面。它能理解用戶意圖并生成準(zhǔn)確答案，實(shí)現(xiàn)高質(zhì)量的自動(dòng)翻譯。此外，模型還可用于

2024-05-04 23:55:44

信而泰×DeepSeek：AI推理引擎驅(qū)動(dòng)網(wǎng)絡(luò)智能診斷邁向 “自愈”時(shí)代

DeepSeek-R1：強(qiáng)大的AI推理引擎底座DeepSeek是由杭州深度求索人工智能基礎(chǔ)技術(shù)研究有限公司開發(fā)的新一代AI大模型。其核心優(yōu)勢(shì)在于強(qiáng)大的推理引擎能力，融合了自然語(yǔ)言處理（NLP）、深度

2025-07-16 15:29:20

進(jìn)一步解讀英偉達(dá) Blackwell 架構(gòu)、NVlink及GB200 超級(jí)芯片

NVIDIA NVLink，支持 FP4 AI 精度。 GB200 NVL72是一款性能卓越的計(jì)算平臺(tái)，采用更快的第二代Transformer引擎和FP8精度，可將大型語(yǔ)言模型的訓(xùn)練速度提升4倍。通過每秒

2024-05-13 17:16:22

LuxStudio增材制造晶格模型自動(dòng)生成平臺(tái)

對(duì)一些非參數(shù)化設(shè)計(jì)師以及3D打印純小白非常不友好。為此，清鋒科技推出了面向增材制造的晶格模型自動(dòng)生成平臺(tái)——LuxStudio，不僅可以實(shí)現(xiàn)多種結(jié)構(gòu)晶格的自動(dòng)生成

2022-11-09 10:43:02

NVIDIA為全球企業(yè)開發(fā)和部署大型語(yǔ)言模型打開一扇新的大門

NVIDIA NeMo Megatron 框架; 可定制的大規(guī)模語(yǔ)言模型Megatron 530B；多GPU、多節(jié)點(diǎn) Triton推理服務(wù)器助力基于語(yǔ)言的AI開發(fā)和部署，推動(dòng)行業(yè)和科學(xué)發(fā)展

2021-11-12 14:30:07

2126

NVIDIA宣布其AI推理平臺(tái)的重大更新

軟件的新功能，該軟件為所有AI模型和框架提供跨平臺(tái)推理；同時(shí)也包含對(duì)NVIDIA TensorRT的更新，該軟件優(yōu)化AI模型并為NVIDIA GPU上的高性能推理提供運(yùn)行時(shí)優(yōu)化。 NVIDIA還推出了NVIDIA A2 Tensor Core GPU，這是一款用于邊

2021-11-12 14:42:53

2690

NVIDIA Triton推理服務(wù)器幫助Teams使用認(rèn)知服務(wù)優(yōu)化語(yǔ)音識(shí)別模型

Microsoft Teams借助AI生成的實(shí)時(shí)字幕和轉(zhuǎn)錄功能，幫助全球?qū)W生和職場(chǎng)人士順利進(jìn)行在線會(huì)議。用于訓(xùn)練的NVIDIA AI計(jì)算技術(shù)和用于推理語(yǔ)音識(shí)別模型的NVIDIA Triton推理服務(wù)器進(jìn)一步提升了這兩個(gè)功能。

2022-01-04 17:45:12

2204

使用NVIDIA Triton推理服務(wù)器簡(jiǎn)化邊緣AI模型部署

　　NVIDIA Triton 有助于在每個(gè)數(shù)據(jù)中心、云和嵌入式設(shè)備中實(shí)現(xiàn)標(biāo)準(zhǔn)化的可擴(kuò)展生產(chǎn) AI 。它支持多個(gè)框架，在 GPU 和 DLA 等多個(gè)計(jì)算引擎上運(yùn)行模型，處理不同類型的推理查詢。通過與 NVIDIA JetPack 的集成， NVIDIA Triton 可用于嵌入式應(yīng)用。

2022-04-18 15:40:02

3480

騰訊云TI平臺(tái)利用NVIDIA Triton推理服務(wù)器構(gòu)造不同AI應(yīng)用場(chǎng)景需求

騰訊云 TI 平臺(tái) TI-ONE 利用 NVIDIA Triton 推理服務(wù)器構(gòu)造高性能推理服務(wù)部署平臺(tái)，使用戶能夠非常便捷地部署包括 TNN 模型在內(nèi)的多種深度學(xué)習(xí)框架下獲得的 AI 模型，并且顯著提升推理服務(wù)的吞吐、提升 GPU 利用率。

2022-09-05 15:33:01

3067

螞蟻鏈AIoT團(tuán)隊(duì)與NVIDIA合作加速AI推理

螞蟻鏈 AIoT 團(tuán)隊(duì)與 NVIDIA 合作，將量化感知訓(xùn)練(QAT)技術(shù)應(yīng)用于深度學(xué)習(xí)模型性能優(yōu)化中，并通過 NVIDIA TensorRT 高性能推理 SDK 進(jìn)行高效率部署，通過 INT8 推理，吞吐量提升了 3 倍，助力螞蟻鏈版權(quán) AI 平臺(tái)中的模型推理服務(wù)大幅降本增效。

2022-09-09 09:53:52

1845

NVIDIA NeMo最新語(yǔ)言模型服務(wù)幫助開發(fā)者定制大規(guī)模語(yǔ)言模型

NVIDIA NeMo 大型語(yǔ)言模型（LLM）服務(wù)幫助開發(fā)者定制大規(guī)模語(yǔ)言模型；NVIDIA BioNeMo 服務(wù)幫助研究人員生成和預(yù)測(cè)分子、蛋白質(zhì)及 DNA

2022-09-22 10:42:29

1203

KT利用NVIDIA AI平臺(tái)訓(xùn)練大型語(yǔ)言模型

韓國(guó)先進(jìn)的移動(dòng)運(yùn)營(yíng)商構(gòu)建包含數(shù)百億個(gè)參數(shù)的大型語(yǔ)言模型，并使用 NVIDIA DGX SuperPOD 平臺(tái)和 NeMo Megatron 框架訓(xùn)練該模型。

2022-09-27 09:24:30

1995

NVIDIA AI平臺(tái)為大型語(yǔ)言模型帶來(lái)巨大收益

隨著大型語(yǔ)言模型（ LLM ）的規(guī)模和復(fù)雜性不斷增長(zhǎng)， NVIDIA 今天宣布更新 NeMo Megatron 框架，提供高達(dá) 30% 的訓(xùn)練速度。

2022-10-10 15:39:42

1436

NVIDIA 和 Evozyne 創(chuàng)建用于生成蛋白質(zhì)的生成式 AI 模型

科學(xué)家使用 NVIDIA BioNeMo 創(chuàng)建出能夠生成高質(zhì)量蛋白質(zhì)的大型語(yǔ)言模型，以此加快藥物研發(fā)并助力創(chuàng)造更具可持續(xù)性的環(huán)境。初創(chuàng)企業(yè) Evozyne 使用 NVIDIA 提供的預(yù)訓(xùn)練 AI

2023-01-13 23:15:02

1012

大型語(yǔ)言模型有哪些用途？

大型語(yǔ)言模型能識(shí)別、總結(jié)、翻譯、預(yù)測(cè)和生成文本及其他內(nèi)容。 AI 應(yīng)用在大型語(yǔ)言模型的幫助下，可用于解決總結(jié)文章、編寫故事和參與長(zhǎng)對(duì)話等多種繁重工作。大型語(yǔ)言模型（LLM）是一種深度學(xué)習(xí)算法，可以

2023-02-23 19:50:04

6084

大型語(yǔ)言模型有哪些用途？大型語(yǔ)言模型如何運(yùn)作呢？

大型語(yǔ)言模型能識(shí)別、總結(jié)、翻譯、預(yù)測(cè)和生成文本及其他內(nèi)容。

2023-03-08 13:57:00

9399

NVIDIA 為全球企業(yè)帶來(lái)生成式 AI 推出用于創(chuàng)建大型語(yǔ)言模型和視覺模型的云服務(wù)

為AI驅(qū)動(dòng)的應(yīng)用構(gòu)建自定義模型 ? 加利福尼亞州圣克拉拉 – GTC – 太平洋時(shí)間 2023年3月21日 – 為了加速企業(yè)應(yīng)用生成式AI，NVIDIA今日宣布推出一套云服務(wù)，使企業(yè)能夠構(gòu)建、完善

2023-03-22 13:45:40

608

Adobe 攜手 NVIDIA 釋放生成式 AI 的力量

的力量，以進(jìn)一步推動(dòng)創(chuàng)作流程的發(fā)展。Adobe 和 NVIDIA 將共同開發(fā)新一代先進(jìn)的生成式 AI 模型，側(cè)重于將生成式 AI 深度集成到全球頂尖創(chuàng)作者和營(yíng)銷人員所使用的應(yīng)用中。 ? 其中一些模型將采取

2023-03-22 14:14:06

641

GTC23 | NVIDIA 為全球企業(yè)帶來(lái)生成式 AI，推出用于創(chuàng)建大型語(yǔ)言模型和視覺模型的云服務(wù)

Foundations 云服務(wù)為 AI 驅(qū)動(dòng)的應(yīng)用構(gòu)建自定義模型加利福尼亞州圣克拉拉 – GTC – 太平洋時(shí)間 2023年3月21日 – 為了加速企業(yè)應(yīng)用生成式 AI，NVIDIA 宣布推出一套云服務(wù)，使企業(yè)

2023-03-23 06:50:04

907

GTC23 | NVIDIA 推出用于大型語(yǔ)言模型和生成式 AI 工作負(fù)載的推理平臺(tái)

– NVIDIA 于今日推出四款推理平臺(tái)。這些平臺(tái)針對(duì)各種快速興起的生成式 AI 應(yīng)用進(jìn)行了優(yōu)化，能夠幫助開發(fā)人員快速構(gòu)建用于提供新服務(wù)和洞察的 AI 驅(qū)動(dòng)的專業(yè)應(yīng)用。這些平臺(tái)將 NVIDIA

2023-03-23 06:55:02

1494

GTC23 | NVIDIA 攜手谷歌云提供強(qiáng)大的全新生成式 AI 平臺(tái)，基于新款 L4 GPU 和 Vertex AI 構(gòu)建

NVIDIA 生成式 AI 推理平臺(tái)將集成至谷歌云 Vertex AI 中；谷歌云成為首家提供 NVIDIA L4 GPU 實(shí)例的云服務(wù)商加利福尼亞州圣克拉拉 – GTC – 太平洋時(shí)間 2023

2023-03-23 06:55:02

1217

GTC23 | NVIDIA 發(fā)布大型語(yǔ)言模型和生成式 AI 服務(wù)以推動(dòng)生命科學(xué)研發(fā)

21 日 – NVIDIA 今日推出一整套用于自定義 AI 基礎(chǔ)模型的生成式 AI 云服務(wù)。這些服務(wù)將加速新蛋白質(zhì)和治療方法的創(chuàng)建以及基因組學(xué)、化學(xué)、生物學(xué)和分子動(dòng)力學(xué)等領(lǐng)域的研究。作為

2023-03-23 06:55:03

1114

ServiceNow 與 NVIDIA 宣布聯(lián)合打造面向企業(yè) IT 的生成式 AI

基于 ServiceNow 平臺(tái)并采用 NVIDIA AI 軟件和 DGX 基礎(chǔ)設(shè)施構(gòu)建的自定義大型語(yǔ)言模型將為企業(yè)帶來(lái)更智能的工作流自動(dòng)化 ServiceNow 和 NVIDIA 宣布達(dá)成合作伙伴

2023-05-19 00:50:02

968

NVIDIA 與微軟合作加速企業(yè)就緒的生成式 AI

NVIDIA AI Enterprise 與 Azure 機(jī)器學(xué)習(xí)集成，提供端到端云平臺(tái)，供開發(fā)者構(gòu)建、部署和管理大型語(yǔ)言模型的 AI 應(yīng)用微軟 Build 大會(huì)——太平洋時(shí)間 2023 年 5

2023-05-25 09:15:02

994

NVIDIA 攜手微軟，在生成式 AI 的新時(shí)代推動(dòng) Windows PC 創(chuàng)新

行業(yè)領(lǐng)導(dǎo)者打破藩籬，使開發(fā)人員能夠輕松地在 Windows 11 上訓(xùn)練并部署先進(jìn)的 AI 模型，并在配備 RTX 的 PC 和工作站上提供節(jié)能的推理。生成式 AI，以 ChatGPT 等大型語(yǔ)言

2023-05-25 09:15:02

1255

大型語(yǔ)言模型能否捕捉到它們所處理和生成的文本中的語(yǔ)義信息

? 大型語(yǔ)言模型能否捕捉到它們所處理和生成的文本中的語(yǔ)義信息？這一問題在計(jì)算機(jī)科學(xué)和自然語(yǔ)言處理領(lǐng)域一直存在爭(zhēng)議。然而，MIT的一項(xiàng)新研究表明，僅基于文本形式訓(xùn)練、用于預(yù)測(cè)下一個(gè)token的語(yǔ)言模型

2023-05-25 11:34:11

1273

COMPUTEX2023 | NVIDIA 推出 DGX GH200 AI 超級(jí)計(jì)算機(jī)

Switch System 驅(qū)動(dòng)的 NVIDIA DGX 超級(jí)計(jì)算機(jī) ，旨在助力開發(fā)面向生成式 AI 語(yǔ)言應(yīng)用、推薦系統(tǒng)和數(shù)據(jù)分析工作負(fù)載的巨型、下一代模型。 NVIDIA DGX GH200 的超大共享內(nèi)存空間通過 NVLink 互連技術(shù) 以及 NV

2023-05-30 01:40:01

2532

NVIDIA 為 1 億臺(tái) Windows RTX PC 和工作站提供全新生成式 AI 功能與突破性性能

搭載 Tensor Core 的 NVIDIA RTX GPU 正在加速生成式 AI 模型的開發(fā)與部署；即將推出的 Max-Q 低功耗 AI 推理將提高能效比。生成式 AI 正在迅速開創(chuàng)一個(gè)計(jì)算

2023-05-31 03:50:02

888

NVIDIA為Windows RTX工作站提供全新生成式AI功能與突破性性能

的推理任務(wù)時(shí)，GPU 將以極低的功耗運(yùn)行，而在運(yùn)行繁重負(fù)載如生成式 AI 工作時(shí)，則可升至極高的性能水平。

2023-06-07 14:55:24

1121

IGT Solutions推出企業(yè)級(jí)生成式人工智能平臺(tái)TechBud.AI以實(shí)現(xiàn)卓越客戶體驗(yàn)

人工智能的無(wú)縫運(yùn)用，這款先進(jìn)的生成式人工智能平臺(tái)可以促進(jìn)快速創(chuàng)新，并幫助企業(yè)實(shí)現(xiàn)更快的結(jié)果和客戶體驗(yàn)的提升。在大型語(yǔ)言模型的支持下，它是一個(gè)安全的可以解決現(xiàn)實(shí)世界企業(yè)挑戰(zhàn)的平臺(tái)。TechBud.AI是一個(gè)可靠、安全的技術(shù)專家級(jí)人工智能伙伴，可以解決查詢、支持任務(wù)，讓用戶的

2023-06-24 21:20:00

1037

Snowflake 攜手 NVIDIA 助力企業(yè)在數(shù)據(jù)云端利用數(shù)據(jù)實(shí)現(xiàn)生成式 AI

AI 應(yīng)用，而這一切都可以在 Snowflake 數(shù)據(jù)云中安全地實(shí)現(xiàn)。憑借用于開發(fā)大語(yǔ)言模型（LLM）的 NVIDIA NeMo 平臺(tái) 以及 NVIDIA GPU 加速計(jì)算，Snowflake 將助力企業(yè)使用 Snowf

2023-06-27 21:10:01

838

大型語(yǔ)言模型的應(yīng)用

?? 大型語(yǔ)言模型（LLM）是一種深度學(xué)習(xí)算法，可以通過大規(guī)模數(shù)據(jù)集訓(xùn)練來(lái)學(xué)習(xí)識(shí)別、總結(jié)、翻譯、預(yù)測(cè)和生成文本及其他內(nèi)容。大語(yǔ)言模型（LLM）代表著 AI 領(lǐng)域的重大進(jìn)步，并有望通過習(xí)得的知識(shí)改變

2023-07-05 10:27:35

2808

即刻報(bào)名第三屆 NVIDIA TensorRT Hackathon 生成式 AI 模型優(yōu)化賽

近日，由阿里云及 NVIDIA 聯(lián)合舉辦的?“NVIDIA TensorRT Hackathon 2023 生成式 AI 模型優(yōu)化賽”已正式啟動(dòng)。此大賽是由阿里云天池組織運(yùn)營(yíng)，TensorRT

2023-07-17 19:45:03

1140

ServiceNow、NVIDIA 和埃森哲攜手合作，助力企業(yè)加快采用生成式 AI

（NYSE: ACN）近日宣布推出 AI 燈塔計(jì)劃。這個(gè)業(yè)界首創(chuàng)的計(jì)劃旨在快速推進(jìn)企業(yè)級(jí)生成式 AI 功能的開發(fā)和采用。在 ServiceNow、NVIDIA 和埃森哲現(xiàn)有戰(zhàn)略合作的基礎(chǔ)上，AI 燈塔

2023-07-31 20:40:02

1331

NVIDIA 與 Hugging Face 將連接數(shù)百萬(wàn)開發(fā)者與生成式 AI 超級(jí)計(jì)算

8 月 8 日 — NVIDIA 與 Hugging Face 宣布建立合作伙伴關(guān)系，為數(shù)百萬(wàn)開發(fā)者提供生成式 AI 超級(jí)計(jì)算服務(wù)，幫助他們構(gòu)建大語(yǔ)言模型（LLM）和其他高級(jí) AI 應(yīng)用。 ? 此次

2023-08-09 11:41:59

435

SIGGRAPH 2023 | NVIDIA 與全球數(shù)據(jù)中心系統(tǒng)制造商大力推動(dòng) AI 與工業(yè)數(shù)字化的發(fā)展

計(jì)算密集型的復(fù)雜應(yīng)用，包括 AI 訓(xùn)練與推理、3D 設(shè)計(jì)與可視化、視頻處理以及工業(yè)數(shù)字化等。這款全新 GPU 將加速生成式 AI 的計(jì)算工作負(fù)載。生成式 A

2023-08-09 19:10:06

858

英偉達(dá)全球首發(fā)HBM3e 專為生成式AI時(shí)代打造

2023年8月8日，NVIDIA創(chuàng)始人兼CEO黃仁勛在計(jì)算機(jī)圖形年會(huì)SIGGRAPH上發(fā)布了HBM3e內(nèi)存新一代GH200 Grace Hopper超級(jí)芯片。這款芯片被黃仁勛稱為“加速計(jì)算和生成式AI時(shí)代的處理器”，旨在用于任何大型語(yǔ)言模型，以降低推理成本。

2023-08-11 16:29:17

2011

VMware 與 NVIDIA 為企業(yè)開啟生成式 AI 時(shí)代

全新 VMware Private AI Foundation With NVIDIA 幫助企業(yè)為生成式 AI 在業(yè)務(wù)中的應(yīng)用做好準(zhǔn)備；該平臺(tái)將在數(shù)據(jù)隱私性、安全性和可控性方面提供進(jìn)一步支持

2023-08-23 19:10:07

1156

NVIDIA AI Enterprise 4.0 推出，助力企業(yè)構(gòu)建生產(chǎn)就緒的生成式 AI 為業(yè)務(wù)賦能

時(shí)。NVIDIA 正在將專業(yè)知識(shí)投入到解決方案的開發(fā)過程中，助力企業(yè)實(shí)現(xiàn)這樣的飛躍。推出 NVIDIA AI Enterprise 4.0 最新版? NVIDIA AI Enterprise? 助力利用生成

2023-09-19 20:20:04

1232

Oracle 云基礎(chǔ)設(shè)施提供新的 NVIDIA GPU 加速計(jì)算實(shí)例

生成式 AI 和大語(yǔ)言模型（LLM）不斷推動(dòng)突破性創(chuàng)新，訓(xùn)練和推理對(duì)算力的需求也隨之急劇上升。這些現(xiàn)代生成式 AI 應(yīng)用需要全棧加速計(jì)算，首先要有能夠快速、準(zhǔn)確處理大量工作負(fù)載的先進(jìn)基礎(chǔ)設(shè)施

2023-09-25 20:40:02

1220

NVIDIA 擴(kuò)展機(jī)器人平臺(tái)，迎接生成式 AI 的崛起

基于 NVIDIA Jetson 平臺(tái)進(jìn)行開發(fā)的 1 萬(wàn)多家公司現(xiàn)在可以利用全新的生成式 AI、API 和微服務(wù)來(lái)加快推進(jìn)行業(yè)數(shù)字化 ? ? 強(qiáng)大的生成式 AI 模型、云原生應(yīng)用程序接口（ API

2023-10-19 17:16:24

853

NVIDIA 擴(kuò)展機(jī)器人平臺(tái)，迎接生成式 AI 的崛起

基于 NVIDIA Jetson 平臺(tái)進(jìn)行開發(fā)的 1 萬(wàn)多家公司現(xiàn)在可以利用全新的生成式 AI、API 和微服務(wù)來(lái)加快推進(jìn)行業(yè)數(shù)字化強(qiáng)大的生成式 AI 模型、云原生應(yīng)用程序接口（API）和微服務(wù)已

2023-10-20 02:05:02

1057

周四研討會(huì)預(yù)告 | 注冊(cè)報(bào)名 NVIDIA AI Inference Day - 大模型推理線上研討會(huì)

由 CSDN 舉辦的 NVIDIA AI Inference Day - 大模型推理線上研討會(huì)，將幫助您了解 NVIDIA 開源大型語(yǔ)言模型（LLM）推理加速庫(kù) TensorRT-LLM ?及其功能

2023-10-26 09:05:02

684

現(xiàn)已公開發(fā)布！歡迎使用 NVIDIA TensorRT-LLM 優(yōu)化大語(yǔ)言模型推理

NVIDIA 于 2023 年 10 月 19 日公開發(fā)布 TensorRT-LLM ，可在 NVIDIA GPU 上加速和優(yōu)化最新的大語(yǔ)言模型（Large Language Models）的推理

2023-10-27 20:05:02

1917

全新NVIDIA Spectrum-X網(wǎng)絡(luò)平臺(tái)構(gòu)筑阿里生成式AI云底座

全新 NVIDIA Spectrum-X 網(wǎng)絡(luò)平臺(tái)構(gòu)筑阿里生成式 AI 云底座。

2023-11-02 09:07:25

1564

利用 NVIDIA Jetson 實(shí)現(xiàn)生成式 AI

交互速率運(yùn)行的 Llama-2-70B 模型。圖 1. 領(lǐng)先的生成式 AI 模型在? Jetson AGX Orin 上的推理性能如要在 Jetson 上快速測(cè)試最新的模型和應(yīng)用，請(qǐng)使用 Jetson 生成式 AI 實(shí)驗(yàn)室提供的教程和資源。

2023-11-07 21:25:01

2182

NVIDIA 為全球領(lǐng)先的 AI 計(jì)算平臺(tái) Hopper 再添新動(dòng)力

Tensor Core GPU 和領(lǐng)先的顯存配置，可處理生成式 AI 與高性能計(jì)算工作負(fù)載的海量數(shù)據(jù)。 ? NVIDIA H200 是首款采用 HBM3e 的 GPU，其運(yùn)行更快、更大的顯存容量將進(jìn)一步加速生成式 AI 與大語(yǔ)言模型，同時(shí)

2023-11-14 14:30:01

827

NVIDIA 在 Microsoft Azure 上推出面向全球企業(yè)和初創(chuàng)公司的生成式 AI Foundry 服務(wù)

Models、NVIDIA NeMo? 框架和工具，以及 NVIDIA DGX? 云 AI 超算服務(wù)三大要素，為企業(yè)提供創(chuàng)建自定義生成式 AI 模型

2023-11-16 14:13:08

859

NVIDIA 在 Microsoft Azure 上推出面向全球企業(yè)和初創(chuàng)公司的生成式 AI Foundry 服務(wù)

AI Enterprise 軟件進(jìn)行部署 NVIDIA 于今日推出一項(xiàng) AI foundry 服務(wù)，助力企業(yè)和初創(chuàng)公司在 Microsoft Azure 上開發(fā)、調(diào)優(yōu)和部署其自定義生成式 AI

2023-11-16 21:15:02

1193

NVIDIA 加快企業(yè)自定義生成式 AI 模型開發(fā)

的業(yè)務(wù)數(shù)據(jù)進(jìn)行自定義。如今，免費(fèi)、開源的大語(yǔ)言模型對(duì)企業(yè)來(lái)說就像是一頓“自助餐”。但對(duì)于構(gòu)建自定義生成式 AI 應(yīng)用的開發(fā)者來(lái)說，這頓“大餐”可能會(huì)讓他們應(yīng)接不暇，因?yàn)樗麄冃枰獫M足各種不同的項(xiàng)目和業(yè)務(wù)

2023-11-16 21:15:02

1309

NVIDIA 通過企業(yè)級(jí)生成式 AI 微服務(wù) 為聊天機(jī)器人、AI 助手和摘要工具帶來(lái)商業(yè)智能

— 太平洋時(shí)間 2023 年 11 月 28 日 — NVIDIA 今日宣布推出一項(xiàng)生成式 AI 微服務(wù)，支持企業(yè)將自定義大語(yǔ)言模型與企業(yè)數(shù)據(jù)相連接，使其 AI 應(yīng)用能夠提供高度準(zhǔn)確的響應(yīng)

2023-11-29 14:37:12

799

NVIDIA 通過企業(yè)級(jí)生成式 AI 微服務(wù)為聊天機(jī)器人、AI 助手和摘要工具帶來(lái)商業(yè)智能

微服務(wù)，支持企業(yè)將自定義大語(yǔ)言模型與企業(yè)數(shù)據(jù)相連接，使其 AI 應(yīng)用能夠提供高度準(zhǔn)確的響應(yīng)。 NVIDIA NeMo Retriever 是 NVIDIA NeMo （一個(gè)用于構(gòu)建、自定義和部署生成式

2023-11-29 21:05:02

1182

NVIDIA 為部分大型亞馬遜 Titan 基礎(chǔ)模型提供訓(xùn)練支持

GPU 和海量的數(shù)據(jù)集上所訓(xùn)練而成。不過這可能會(huì)給想要使用生成式 AI 的企業(yè)帶來(lái)很多巨大的挑戰(zhàn)。 NVIDIA NeMo （一個(gè)用于構(gòu)建、自定義和運(yùn)行 LLM 的框架）能夠幫助企業(yè)克服上述挑戰(zhàn)

2023-11-29 21:15:02

1183

大語(yǔ)言模型簡(jiǎn)介：基于大語(yǔ)言模型模型全家桶Amazon Bedrock

本文基于亞馬遜云科技推出的大語(yǔ)言模型與生成式AI的全家桶：Bedrock對(duì)大語(yǔ)言模型進(jìn)行介紹。大語(yǔ)言模型指的是具有數(shù)十億參數(shù)（B+）的預(yù)訓(xùn)練語(yǔ)言模型（例如：GPT-3, Bloom, LLaMA)。這種模型可以用于各種自然語(yǔ)言處理任務(wù)，如文本生成、機(jī)器翻譯和自然語(yǔ)言理解等。

2023-12-04 15:51:46

1470

安霸發(fā)布全新N1系列生成式AI芯片

安霸在CES 2024上發(fā)布了全新的N1系列生成式AI芯片，這是一款專門為前端設(shè)備設(shè)計(jì)的芯片，支持本地運(yùn)行大型語(yǔ)言模型（LLM）應(yīng)用。其單顆SoC能夠支持1至340億參數(shù)的多模態(tài)大模型（Multi-Modal LLM）推理，從而實(shí)現(xiàn)低功耗的生成式AI功能。

2024-01-09 15:32:54

2295

NVIDIA生成式AI開啟藥物研發(fā)與設(shè)計(jì)的新紀(jì)元

NVIDIA BioNeMo 現(xiàn)已提供十余個(gè)生成式 AI 模型以及云服務(wù)，正在推動(dòng)計(jì)算機(jī)輔助藥物發(fā)現(xiàn)生態(tài)系統(tǒng)的發(fā)展。

2024-01-10 16:00:05

1255

NVIDIA Isaac將生成式AI應(yīng)用于制造業(yè)和物流業(yè)

NVIDIA Isaac 機(jī)器人平臺(tái)利用最新的生成式 AI 和先進(jìn)的仿真技術(shù)，加速 AI 機(jī)器人技術(shù)的發(fā)展。

2024-03-22 10:06:21

1297

生成式 AI 進(jìn)入模型驅(qū)動(dòng)時(shí)代

隨著ChatGPT和大型語(yǔ)言模型(LLM)呈現(xiàn)爆炸式增長(zhǎng)，生成式人工智能(GenerativeAI)成為近來(lái)的一大熱詞。由此引發(fā)了一場(chǎng)爭(zhēng)論：哪種AI模型使用的訓(xùn)練參數(shù)最多？與此同時(shí)，更多

2024-04-13 08:12:27

1132

世界數(shù)字技術(shù)院發(fā)布：生成式AI安全測(cè)試標(biāo)準(zhǔn)及大語(yǔ)言模型

據(jù)悉，上述兩款標(biāo)準(zhǔn)主要針對(duì)大型模型與生成式AI應(yīng)用領(lǐng)域的安全檢測(cè)設(shè)定了新基準(zhǔn)。參與制定工作的單位有OpenAI、螞蟻集團(tuán)、科大訊飛、谷歌、微軟、英偉達(dá)、百度、騰訊等多家知名企業(yè)，其中，《大語(yǔ)言模型安全測(cè)試方法》由螞蟻集團(tuán)主導(dǎo)完成。

2024-04-17 16:51:04

2059

NVIDIA加速微軟最新的Phi-3 Mini開源語(yǔ)言模型

NVIDIA 宣布使用 NVIDIA TensorRT-LLM 加速微軟最新的 Phi-3 Mini 開源語(yǔ)言模型。TensorRT-LLM 是一個(gè)開源庫(kù)，用于優(yōu)化從 PC 到云端的 NVIDIA GPU 上運(yùn)行的大語(yǔ)言模型推理。

2024-04-28 10:36:08

1584

Snowflake推出企業(yè)級(jí)AI模型

Snowflake公司近日重磅推出了一款名為Snowflake Arctic的企業(yè)級(jí)大型語(yǔ)言模型（LLM）。這款AI模型針對(duì)復(fù)雜的企業(yè)工作負(fù)載進(jìn)行了深度優(yōu)化，特別是在SQL代碼生成和指令跟蹤等方面，表現(xiàn)卓越，已超越多個(gè)行業(yè)基準(zhǔn)。

2024-05-06 14:38:54

871

Snowflake推出面向企業(yè)AI的大語(yǔ)言模型

Snowflake公司近日推出了企業(yè)級(jí)AI模型——Snowflake Arctic，這是一款大型語(yǔ)言模型（LLM），專為滿足企業(yè)復(fù)雜工作負(fù)載的需求而設(shè)計(jì)。Snowflake Arctic在多個(gè)關(guān)鍵領(lǐng)域，如SQL代碼生成和指令跟蹤等，均超越了行業(yè)基準(zhǔn)，展現(xiàn)出卓越的性能。

2024-05-07 10:03:54

915

英偉達(dá)推出AI模型推理服務(wù)NVIDIA NIM

英偉達(dá)近日宣布推出一項(xiàng)革命性的AI模型推理服務(wù)——NVIDIA NIM。這項(xiàng)服務(wù)將極大地簡(jiǎn)化AI模型部署過程，為全球的2800萬(wàn)英偉達(dá)開發(fā)者提供前所未有的便利。

2024-06-04 09:15:06

1278

NVIDIA宣布全面推出 NVIDIA ACE 生成式 AI 微服務(wù)

采用 NVIDIA 宣布全面推出 NVIDIA ACE 生成式 AI 微服務(wù)，以加速新一代數(shù)字人的發(fā)展，并將在平臺(tái)上推出全新的生成式 AI 突破?？蛻舴?wù)、游戲和醫(yī)療健康領(lǐng)域的公司率先采用 ACE

2024-06-04 10:18:37

1413

如何加速大語(yǔ)言模型推理

隨著人工智能技術(shù)的飛速發(fā)展，大語(yǔ)言模型（LLM）已成為自然語(yǔ)言處理領(lǐng)域的核心工具，廣泛應(yīng)用于智能客服、文本生成、機(jī)器翻譯等多個(gè)場(chǎng)景。然而，大語(yǔ)言模型的高計(jì)算復(fù)雜度和資源消耗成為其在實(shí)際應(yīng)用中面臨

2024-07-04 17:32:04

1976

基于CPU的大型語(yǔ)言模型推理實(shí)驗(yàn)

隨著計(jì)算和數(shù)據(jù)處理變得越來(lái)越分散和復(fù)雜，AI 的重點(diǎn)正在從初始訓(xùn)練轉(zhuǎn)向更高效的AI 推理。Meta 的 Llama3 是功能強(qiáng)大的公開可用的大型語(yǔ)言模型（LLM）。本次測(cè)試采用開源 LLM

2024-07-18 14:28:51

1401

英偉達(dá)推出全新NVIDIA AI Foundry服務(wù)和NVIDIA NIM推理微服務(wù)

NVIDIA 宣布推出全新 NVIDIA AI Foundry 服務(wù)和 NVIDIA NIM 推理微服務(wù)，與同樣剛推出的 Llama 3.1 系列開源模型一起，為全球企業(yè)的生成式 AI 提供強(qiáng)力支持。

2024-07-25 09:48:21

1350

NVIDIA攜手Meta推出AI服務(wù)，為企業(yè)提供生成式AI服務(wù)

NVIDIA近日宣布了一項(xiàng)重大舉措，正式推出NVIDIA AI Foundry服務(wù)與NVIDIA NIM（NVIDIA Inference Microservices）推理微服務(wù)，這兩項(xiàng)創(chuàng)新成果與同步問世的Llama 3.1系列開源模型強(qiáng)強(qiáng)聯(lián)合，為全球企業(yè)構(gòu)建強(qiáng)大的生成式AI能力鋪設(shè)了堅(jiān)實(shí)的基石。

2024-07-25 16:57:37

1068

三行代碼完成生成式AI部署

OpenVINO2024.2版本跟之前版本最大的不同是OpenVINO2024.2分為兩個(gè)安裝包分別是基礎(chǔ)包與生成式AI支持包，新發(fā)布的GenAI開發(fā)包支持C++與Python語(yǔ)言接口調(diào)用，支持多種

2024-08-30 16:49:58

1273

AMD助力HyperAccel開發(fā)全新AI推理服務(wù)器

HyperAccel 是一家成立于 2023 年 1 月的韓國(guó)初創(chuàng)企業(yè)，致力于開發(fā) AI 推理專用型半導(dǎo)體器件和硬件，最大限度提升推理工作負(fù)載的存儲(chǔ)器帶寬使用，并通過將此解決方案應(yīng)用于大型語(yǔ)言模型來(lái)

2024-09-18 09:37:26

1202

NVIDIA NIM助力企業(yè)高效部署生成式AI模型

Canonical、Nutanix 和 Red Hat 等廠商的開源 Kubernetes 平臺(tái)集成了 NVIDIA NIM，將允許用戶通過 API 調(diào)用來(lái)大規(guī)模地部署大語(yǔ)言模型。

2024-10-10 09:49:24

1199

NVIDIA助力Amdocs打造生成式AI智能體

正在使用NVIDIA DGX Cloud 與 NVIDIA AI Enterprise軟件開發(fā)和交付基于商用大語(yǔ)言模型（LLM）和領(lǐng)域適配模型的解決方案。該公司還在使用NVIDIA NIM，這是一套易于使用的推理微服務(wù)，旨在加速生成式 AI 在企業(yè)中的部署。

2024-11-19 14:48:15

1401

NVIDIA推出全新生成式AI模型Fugatto

NVIDIA 開發(fā)了一個(gè)全新的生成式 AI 模型。利用輸入的文本和音頻，該模型可以創(chuàng)作出包含任意的音樂、人聲和聲音組合的作品。

2024-11-27 11:29:39

1230

大語(yǔ)言模型開發(fā)框架是什么

大語(yǔ)言模型開發(fā)框架是指用于訓(xùn)練、推理和部署大型語(yǔ)言模型的軟件工具和庫(kù)。下面，AI部落小編為您介紹大語(yǔ)言模型開發(fā)框架。

2024-12-06 10:28:43

926

Google兩款先進(jìn)生成式AI模型登陸Vertex AI平臺(tái)

新的 AI 模型，包括最先進(jìn)的視頻生成模型Veo以及最高品質(zhì)的圖像生成模型Imagen 3。近日，我們?cè)?Google Cloud 上進(jìn)一步推動(dòng)這一勢(shì)頭，客戶可以在Vertex AI平臺(tái)上使用這兩款先進(jìn)的生成式 AI 模型。

2024-12-30 09:56:10

1054

NVIDIA Cosmos世界基礎(chǔ)模型平臺(tái)發(fā)布

NVIDIA 宣布推出NVIDIA Cosmos，該平臺(tái)由先進(jìn)的生成式世界基礎(chǔ)模型、高級(jí) tokenizer、護(hù)欄和加速視頻處理管線組成，將推動(dòng)自動(dòng)駕駛汽車（AV）和機(jī)器人等物理 AI 系統(tǒng)的發(fā)展。

2025-01-08 10:39:32

1123

NVIDIA推出多個(gè)生成式AI模型和藍(lán)圖

NVIDIA 宣布推出多個(gè)生成式 AI 模型和藍(lán)圖，將 NVIDIA Omniverse 一體化進(jìn)一步擴(kuò)展至物理 AI 應(yīng)用，如機(jī)器人、自動(dòng)駕駛汽車和視覺 AI 等。全球軟件開發(fā)和專業(yè)服務(wù)領(lǐng)域的領(lǐng)先企業(yè)正在使用 Omniverse 開發(fā)新的產(chǎn)品和服務(wù)，加快工業(yè) AI 新時(shí)代的到來(lái)。

2025-01-08 10:48:54

1119

NVIDIA發(fā)布Cosmos?平臺(tái)，助力物理AI系統(tǒng)發(fā)展

NVIDIA近日宣布推出全新的NVIDIA Cosmos?平臺(tái)，該平臺(tái)專為自動(dòng)駕駛汽車(AV)和機(jī)器人等物理AI系統(tǒng)而設(shè)計(jì)，旨在推動(dòng)這些領(lǐng)域的快速發(fā)展。 Cosmos平臺(tái)融合了先進(jìn)的生成式世界

2025-01-08 15:36:45

958

NVIDIA推出開放式Llama Nemotron系列模型

作為 NVIDIA NIM 微服務(wù)，開放式 Llama Nemotron 大語(yǔ)言模型和 Cosmos Nemotron 視覺語(yǔ)言模型可在任何加速系統(tǒng)上為 AI 智能體提供強(qiáng)效助力。

2025-01-09 11:11:40

1330

NVIDIA Omniverse擴(kuò)展至生成式物理AI領(lǐng)域

NVIDIA近日宣布，其Omniverse?平臺(tái)再次實(shí)現(xiàn)重大突破，成功推出多個(gè)生成式AI模型和藍(lán)圖，將Omniverse的應(yīng)用范圍進(jìn)一步擴(kuò)展至物理AI領(lǐng)域，包括機(jī)器人、自動(dòng)駕駛汽車和視覺AI等多個(gè)

2025-01-13 10:56:31

1131

新品| LLM630 Compute Kit，AI 大語(yǔ)言模型推理開發(fā)平臺(tái)

LLM630LLM推理，視覺識(shí)別，可開發(fā)，靈活擴(kuò)展···LLM630ComputeKit是一款AI大語(yǔ)言模型推理開發(fā)平臺(tái)，專為邊緣計(jì)算和智能交互應(yīng)用而設(shè)計(jì)。該套件的主板搭載愛芯AX630CSoC

2025-01-17 18:48:02

1268

使用NVIDIA推理平臺(tái)提高AI推理性能

NVIDIA推理平臺(tái)提高了 AI 推理性能，為零售、電信等行業(yè)節(jié)省了數(shù)百萬(wàn)美元。

2025-02-08 09:59:03

1512

NVIDIA 推出開放推理 AI 模型系列，助力開發(fā)者和企業(yè)構(gòu)建代理式 AI 平臺(tái)

、德勤、IQVIA、微軟、SAP 和 ServiceNow 與 NVIDIA 合作，率先推出推理 AI 智能體，改變工作方式 ? ? ? 美國(guó)加利福尼亞州圣何塞 —— ?GTC —— 2025 年 3

2025-03-19 09:31:53

352

NVIDIA 與行業(yè)領(lǐng)先的存儲(chǔ)企業(yè)共同推出面向 AI 時(shí)代的新型企業(yè)基礎(chǔ)設(shè)施

3 月 18 日 —— NVIDIA 今日推出了 NVIDIA AI 數(shù)據(jù)平臺(tái) —— 一項(xiàng)可自定義的參考設(shè)計(jì)，領(lǐng)先的存儲(chǔ)提供商可用來(lái)構(gòu)建全新的 AI 基礎(chǔ)設(shè)施，以滿足 AI 推理工作負(fù)載的嚴(yán)苛要求

2025-03-19 10:11:45

450

Oracle 與 NVIDIA 合作助力企業(yè)加速代理式 AI 推理

——Oracle 和 NVIDIA 今日宣布，NVIDIA 加速計(jì)算和推理軟件與 Oracle 的 AI 基礎(chǔ)設(shè)施以及生成式 AI 服務(wù)首次實(shí)現(xiàn)集成，以幫助全球企業(yè)組織加速創(chuàng)建代理式 AI 應(yīng)用。 ? 此次

2025-03-19 15:24:36

504

英偉達(dá)GTC2025亮點(diǎn) NVIDIA推出Cosmos世界基礎(chǔ)模型和物理AI數(shù)據(jù)工具的重大更新

推理模型，讓開發(fā)者以前所未有的方式控制世界生成。 NVIDIA 還推出了兩款由 NVIDIA Omniverse 和 Cosmos 平臺(tái)提供支持的新藍(lán)圖，為開發(fā)者提供用于機(jī)

2025-03-20 19:01:26

1226

英偉達(dá)GTC2025亮點(diǎn)：NVIDIA與行業(yè)領(lǐng)先存儲(chǔ)企業(yè)共同推出面向AI時(shí)代的新型企業(yè)基礎(chǔ)設(shè)施

存儲(chǔ)提供商構(gòu)建搭載 AI 查詢智能體的基礎(chǔ)設(shè)施，利用 NVIDIA 計(jì)算、網(wǎng)絡(luò)和軟件，針對(duì)復(fù)雜查詢進(jìn)行推理并快速生成準(zhǔn)確響應(yīng) NVIDIA 推出了 NVIDIA AI 數(shù)據(jù)平臺(tái) —— 一項(xiàng)可自定義

2025-03-21 09:42:43

1146

使用NVIDIA Earth-2生成式AI基礎(chǔ)模型革新氣候建模

NVIDIA 正通過 cBottle（Climate in a Bottle 的簡(jiǎn)稱）為這項(xiàng)工作帶來(lái)新的突破，這是全球首個(gè)專為以公里尺度分辨率模擬全球氣候而設(shè)計(jì)的生成式 AI 基礎(chǔ)模型。

2025-06-12 15:54:21

1141

利用NVIDIA推理模型構(gòu)建AI智能體

開放式推理模型能夠更快、更廣泛地進(jìn)行思考，為客戶服務(wù)、網(wǎng)絡(luò)安全、制造、物流和機(jī)器人等領(lǐng)域的 AI 智能體生成更明智的結(jié)果。

2025-08-13 14:32:27

1422

NVIDIA Nemotron Nano 2推理模型發(fā)布

NVIDIA 正式推出準(zhǔn)確、高效的混合 Mamba-Transformer 推理模型系列 NVIDIA Nemotron Nano 2。

2025-08-27 12:45:44

1573

什么是AI模型的推理能力

NVIDIA 的數(shù)據(jù)工廠團(tuán)隊(duì)為 NVIDIA Cosmos Reason 等 AI 模型奠定了基礎(chǔ)，該模型近日在 Hugging Face 的物理推理模型排行榜中位列榜首。

2025-09-23 15:19:23

1043

通過NVIDIA Jetson AGX Thor實(shí)現(xiàn)7倍生成式AI性能

Jetson Thor 平臺(tái)還支持多種主流量化格式，包括 NVIDIA Blackwell GPU 架構(gòu)的新 NVFP4 格式，有助于進(jìn)一步優(yōu)化推理性能。該平臺(tái)同時(shí)支持推測(cè)解碼等新技術(shù)，為在邊緣端加速生成式 AI 工作負(fù)載提供了新的途徑。

2025-10-29 16:53:18

1249

已全部加載完成

chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛兴趣闲谈,欧美亚洲精品 8区,国产精品久久久久精品免费

搜索歷史

NVIDIA推出用于大型語(yǔ)言模型和生成式AI工作負(fù)載的推理平臺(tái)

評(píng)論