chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

NVIDIA Blackwell白皮書:NVIDIA Blackwell Architecture Technical Brief

向上 ? 2025-03-20 18:35 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

NVIDIA Blackwell 架構(gòu)為生成式 AI加速計(jì)算帶來的突破性進(jìn)步。Blackwell 基于多代** NVIDIA 技術(shù)構(gòu)建,以出眾的性能、效率和規(guī)模揭開了生成式 AI 領(lǐng)域的新篇章。

NVIDIA Blackwell Architecture Technical Brief免費(fèi)下載
*附件:NVIDIA Blackwell Architecture Technical Brief.doc

新型 AI 超級(jí)芯片

Blackwell 架構(gòu) GPU 具有 2080 億個(gè)晶體管,采用專門定制的臺(tái)積電 4NP 工藝制造。所有 Blackwell 產(chǎn)品均采用雙倍光刻極限尺寸的裸片,通過 10 TB/s 的片間互聯(lián)技術(shù)連接成一塊統(tǒng)一的 GPU。

第二代 Transformer 引擎

第二代 Transformer 引擎將定制的 Blackwell Tensor Core技術(shù)與 NVIDIA? TensorRT? -LLM 和 NeMo? 框架創(chuàng)新相結(jié)合,加速大語(yǔ)言模型 (LLM) 和專家混合模型 (MoE) 的推理和訓(xùn)練。

為了強(qiáng)效助力 MoE 模型的推理 Blackwell Tensor Core增加了新的精度 (包括新的社區(qū)定義的微縮放格式),可提供較高的準(zhǔn)確性并輕松替換更大的精度。Blackwell Transformer 引擎利用稱為微張量縮放的細(xì)粒度縮放技術(shù),優(yōu)化性能和準(zhǔn)確性,支持 4 位浮點(diǎn) (FP4) AI。這將內(nèi)存可以支持的新一代模型的性能和大小翻倍,同時(shí)保持高精度

安全 AI

Blackwell 內(nèi)置 NVIDIA 機(jī)密計(jì)算技術(shù),可通過基于硬件的強(qiáng)大安全性保護(hù)敏感數(shù)據(jù)和 AI 模型,使其免遭未經(jīng)授權(quán)的訪問。Blackwell 是業(yè)內(nèi)首款具備可信執(zhí)行環(huán)境 (TEE) I/O 功能的 GPU,它不僅能夠與具備 TEE-I/O 功能的主機(jī)一同提供性能卓越的機(jī)密計(jì)算解決方案,還能通過 NVIDIA? NVLink? 技術(shù)提供實(shí)時(shí)保護(hù)。與未加密模式相比, Blackwell 機(jī)密計(jì)算功能供了幾乎相同的吞吐量性能?,F(xiàn)在,除了保護(hù) AI 知識(shí)產(chǎn)權(quán) (IP) 和安全地實(shí)現(xiàn)機(jī)密 AI 訓(xùn)練、推理和聯(lián)邦學(xué)習(xí),企業(yè)甚至還能以高性能的方式保護(hù)最大的模型。

NVLink、NVSwitch 和 NVLink Switch 系統(tǒng)

是否能釋放百億億級(jí)計(jì)算和萬億參數(shù) AI 模型的全部潛力取決于服務(wù)器集群中每個(gè) GPU 之間能否快速、順暢的通信。第五代 NVIDIA? NVLink? 可擴(kuò)展至 576 個(gè) GPU,為萬億和數(shù)萬億參數(shù) AI 模型釋放加速性能。

NVIDIA NVLink 交換機(jī)芯片可在一個(gè)有 72 個(gè) GPU 的 NVLink 域 (NVL72) 中實(shí)現(xiàn) 130TB/s 的 GPU 帶寬,并通過 NVIDIA SHARP? 技術(shù)對(duì) FP8 的支持實(shí)現(xiàn) 4 倍于原來的帶寬效率。NVIDIA NVLink 交換機(jī)芯片能以驚人的 1.8TB/s 互連速度為多服務(wù)器集群提供支持。采用 NVLink 的多服務(wù)器集群可以在計(jì)算量增加的情況下同步擴(kuò)展 GPU 通信,因此 NVL72 可支持的 GPU 吞吐量是單個(gè) 8 卡 GPU 系統(tǒng)的 9 倍。

解壓縮引擎

過去,數(shù)據(jù)分析和數(shù)據(jù)庫(kù)工作流依賴 CPU 進(jìn)行計(jì)算。加速數(shù)據(jù)科學(xué)可以顯著提高端到端分析性能,加速價(jià)值創(chuàng)造,同時(shí)降低成本。Apache Spark 等數(shù)據(jù)庫(kù)在接手、處理和分析大量數(shù)據(jù)等數(shù)據(jù)分析工作上發(fā)揮著關(guān)鍵作用。

Blackwell 擁有的解壓縮引擎以及通過 900GB/s 雙向帶寬的高速鏈路訪問 NVIDIA Grace? CPU 中大量?jī)?nèi)存的能力,可加速整個(gè)數(shù)據(jù)庫(kù)查詢工作流,從而在數(shù)據(jù)分析和數(shù)據(jù)科學(xué)方面實(shí)現(xiàn)更高性能。Blackwell 支持 LZ4、Snappy 和 Deflate 等最新壓縮格式。

可靠性、可用性和可服務(wù)性 (RAS) 引擎

Blackwell 通過專用的可靠性、可用性和可服務(wù)性 (RAS) 引擎增加了智能恢復(fù)能力,以識(shí)別早期可能發(fā)生的潛在故障,從而更大限度地減少停機(jī)時(shí)間。NVIDIA AI 驅(qū)動(dòng)的預(yù)測(cè)管理功能持續(xù)監(jiān)控硬件和軟件中數(shù)千個(gè)數(shù)據(jù)點(diǎn)的整體運(yùn)行狀況,以預(yù)測(cè)和攔截停機(jī)時(shí)間和低效的來源。這建立了智能可靠性技術(shù),節(jié)省時(shí)間、能源和計(jì)算成本。

NVIDIA 的 RAS 引擎提供深入的診斷信息,可以識(shí)別關(guān)注領(lǐng)域并制定維護(hù)計(jì)劃。RAS 引擎通過快速定位問題來源縮短周轉(zhuǎn)時(shí)間,并通過促進(jìn)有效的補(bǔ)救最大限度地減少停機(jī)時(shí)間。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • NVIDIA
    +關(guān)注

    關(guān)注

    14

    文章

    5489

    瀏覽量

    109015
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    NVIDIA RTX PRO 2000 Blackwell GPU性能測(cè)試

    越來越多的應(yīng)用正在使用 AI 加速,而無論工作站的大小或形態(tài)如何,都有越來越多的用戶需要 AI 性能。NVIDIA RTX PRO 2000 Blackwell 是全新 NVIDIA
    的頭像 發(fā)表于 11-28 09:39 ?2420次閱讀
    <b class='flag-5'>NVIDIA</b> RTX PRO 2000 <b class='flag-5'>Blackwell</b> GPU性能測(cè)試

    進(jìn)一步解讀英偉達(dá) Blackwell 架構(gòu)、NVlink及GB200 超級(jí)芯片

    能比上一代NVIDIA Hopper?提高了15倍。采用第二代Transformer引擎、定制的Blackwell Tensor Core技術(shù)、TensorRT?-LLM和Nemo?框架的創(chuàng)新,顯著加速了
    發(fā)表于 05-13 17:16

    jAVA語(yǔ)言環(huán)境白皮書

    jAVA語(yǔ)言環(huán)境白皮書The Java Language Environment (A White Paper)1. Introduction to Java
    發(fā)表于 10-14 17:35

    最新的智能電網(wǎng)的白皮書資料

    ,因而遇到的這些問題并非那些打從資料、技術(shù)方案所能解決的,所以自己就養(yǎng)成了搜集各大公司智能電網(wǎng)的白皮書的習(xí)慣。 下面各大公司2010年最新的智能電網(wǎng)的白皮書資料,在這里分享出來,有需要的童鞋可以去看
    發(fā)表于 12-23 21:08

    ZigBee白皮書

    ZigBee白皮書
    發(fā)表于 08-20 09:50

    簡(jiǎn)儀科技怒對(duì)LabVIEW的白皮書

    本帖最后由 niezidong 于 2017-8-23 20:43 編輯 簡(jiǎn)儀科技最近搞的開源平臺(tái)跟NI是針鋒相對(duì)啊。近期的宣傳都帶火藥味,還出了一本白皮書。見附件。這白皮書就差直接說搞LabVIEW沒前途了。各位對(duì)此有何高見?
    發(fā)表于 08-11 15:55

    IPTV服務(wù)質(zhì)量白皮書

    IPTV服務(wù)質(zhì)量白皮書
    發(fā)表于 10-14 14:11

    NVIDIA 推出 Blackwell 架構(gòu) DGX SuperPOD,適用于萬億參數(shù)級(jí)的生成式 AI 超級(jí)計(jì)算

    基于先進(jìn)的 NVIDIA 網(wǎng)絡(luò)、NVIDIA 全棧 AI 軟件和存儲(chǔ)技術(shù),可將集群中 Grace Blackwell 超級(jí)芯片的數(shù)量擴(kuò)展至數(shù)萬個(gè),通過 NVIDIA NVLink可將多
    發(fā)表于 03-19 10:56 ?1054次閱讀
    <b class='flag-5'>NVIDIA</b> 推出 <b class='flag-5'>Blackwell</b> 架構(gòu) DGX SuperPOD,適用于萬億參數(shù)級(jí)的生成式 AI 超級(jí)計(jì)算

    NVIDIA推出搭載GB200 Grace Blackwell超級(jí)芯片的NVIDIA DGX SuperPOD?

    NVIDIA 于太平洋時(shí)間 3 月 18 日發(fā)布新一代 AI 超級(jí)計(jì)算機(jī) —— 搭載 NVIDIA GB200 Grace Blackwell 超級(jí)芯片的 NVIDIA DGX Sup
    的頭像 發(fā)表于 03-21 09:49 ?1793次閱讀

    NVIDIA AI芯片Blackwell推遲發(fā)布引熱議,公司強(qiáng)調(diào)Hopper需求強(qiáng)勁

    據(jù)8月5日最新消息,NVIDIA新款A(yù)I芯片Blackwell因被曝存在設(shè)計(jì)缺陷而推遲發(fā)布的消息,迅速在業(yè)界引發(fā)了廣泛討論與關(guān)注。面對(duì)這一市場(chǎng)傳聞,NVIDIA官方迅速作出回應(yīng),強(qiáng)調(diào)其旗艦產(chǎn)品
    的頭像 發(fā)表于 08-05 15:05 ?1088次閱讀

    NVIDIA未來1年的Blackwell訂單已全部售罄

    10月12日資訊顯示,Blackwell無疑已成為NVIDIA歷史上極為成功的產(chǎn)品典范,其市場(chǎng)需求量已攀升至前所未有的高峰。   憑借在全球AI算力領(lǐng)域的領(lǐng)先地位,Blackwell吸引了微軟、Meta、Oracle、Op
    的頭像 發(fā)表于 10-12 16:20 ?1354次閱讀

    NVIDIA向開放計(jì)算項(xiàng)目捐贈(zèng)Blackwell平臺(tái)設(shè)計(jì)

    近日,在美國(guó)加利福尼亞州舉行的 OCP 全球峰會(huì)上,NVIDIA 宣布已把 NVIDIA Blackwell 加速計(jì)算平臺(tái)的一些基礎(chǔ)元素捐贈(zèng)給開放計(jì)算項(xiàng)目(OCP),并擴(kuò)大 NVIDIA
    的頭像 發(fā)表于 11-19 15:30 ?988次閱讀

    英偉達(dá)GTC25亮點(diǎn):NVIDIA Blackwell Ultra 開啟 AI 推理新時(shí)代

    英偉達(dá)GTC25亮點(diǎn):NVIDIA Blackwell Ultra 開啟 AI 推理新時(shí)代
    的頭像 發(fā)表于 03-20 15:35 ?1195次閱讀

    NVIDIA Blackwell數(shù)據(jù)手冊(cè)與NVIDIA Blackwell架構(gòu)技術(shù)解析

    NVIDIA Blackwell數(shù)據(jù)手冊(cè)與NVIDIA Blackwell 架構(gòu)技術(shù)解析
    的頭像 發(fā)表于 03-20 17:19 ?1654次閱讀

    NVIDIA RTX PRO 4500 Blackwell GPU測(cè)試分析

    今天我們帶來全新 NVIDIA Blackwell 架構(gòu) GPU —— NVIDIA RTX PRO 4500 Blackwell 的測(cè)試,對(duì)比上一代產(chǎn)品
    的頭像 發(fā)表于 08-28 11:02 ?2779次閱讀
    <b class='flag-5'>NVIDIA</b> RTX PRO 4500 <b class='flag-5'>Blackwell</b> GPU測(cè)試分析