chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

英偉達(dá)Grace Hopper CPU架構(gòu)

半導(dǎo)體產(chǎn)業(yè)縱橫 ? 來源:半導(dǎo)體產(chǎn)業(yè)縱橫 ? 作者:半導(dǎo)體產(chǎn)業(yè)縱橫 ? 2022-08-23 16:02 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

英偉達(dá)的 Grace CPU 和 Grace Hopper Superchip 有望在 2023 年初發(fā)布。

英偉達(dá)在下周的 Hot Chips 34 發(fā)布會之前宣布了有關(guān)Grace CPU Superchip的新細(xì)節(jié),并透露該芯片采用4N工藝制造。英偉達(dá)還分享了有關(guān)架構(gòu)、數(shù)據(jù)結(jié)構(gòu)、性能和效率基準(zhǔn)的更多信息。Grace芯片和服務(wù)器將在2023年上半年投入市場。

英偉達(dá)的Grace CPU是該公司第一款專為數(shù)據(jù)中心設(shè)計的CPU專用Arm芯片,在一塊主板上有兩個芯片,共144個核心,而Grace Hopper超級芯片則將Hopper GPU和Grace CPU結(jié)合在同一塊板上。在披露中,英偉達(dá)最終正式確認(rèn) Grace CPU 使用 TSMC 4N 工藝。臺積電在其5nm節(jié)點(diǎn)系列中列出了“N4”4nm工藝,將其描述為5nm節(jié)點(diǎn)的增強(qiáng)版。英偉達(dá)使用該節(jié)點(diǎn)的專用變體,稱為“4N”,專門針對其GPU和CPU進(jìn)行了優(yōu)化。

隨著摩爾定律的減弱,這些類型的專用節(jié)點(diǎn)變得越來越普遍,隨著每個新節(jié)點(diǎn)的出現(xiàn),晶體管的縮小變得越來越困難,成本也越來越高。為了實(shí)現(xiàn)英偉達(dá)4N等定制工藝節(jié)點(diǎn),芯片設(shè)計公司和代工廠攜手合作,使用設(shè)計技術(shù)協(xié)同優(yōu)化(DTCO)為其特定產(chǎn)品輸入定制功率、性能和面積(PPA)特性。

英偉達(dá)此前曾透露,其 Grace CPU 使用現(xiàn)成的Arm Neoverse內(nèi)核作為其Grace CPU,但該公司尚未指定使用哪種特定版本。然而,英偉達(dá)披露,Grace使用Arm v9內(nèi)核并支持SVE2,Neoverse N2平臺是Arm第一個支持Arm V7和SVE2等擴(kuò)展的IP。N2 Perseus 平臺采用 5nm 設(shè)計(N4 屬于 TSMC 的 5nm 系列)并支持 PCIe Gen 5.0、DDR5、HBM3、CCIX 2.0 和 CXL 2.0。Perseus 設(shè)計針對每功率性能(瓦特)和每面積性能進(jìn)行了優(yōu)化。Arm 表示,其下一代核心 Poseidon 要到 2024 年才會上市,考慮到 Grace 2023 年初的發(fā)布日期,這些核心不太可能成為候選者。

英偉達(dá)Grace Hopper CPU 架構(gòu)

英偉達(dá)的新NVDIA calable Coherency Fabric (SCF) 是一種網(wǎng)狀互連,與Arm Neoverse核心使用的標(biāo)準(zhǔn)CMN-700相干網(wǎng)狀網(wǎng)絡(luò)非常相似。

英偉達(dá)SCF 在各種 Grace 芯片單元(如 CPU 內(nèi)核、內(nèi)存和 I/O)之間提供 3.2 TB/s 的雙向帶寬,更不用說將芯片連接到主板上其他單元(無論是另一個Grace CPU還是Hopper GPU)的NVLink-C2C接口

1010cdb0-2070-11ed-ba43-dac502259ad0.png

該網(wǎng)格支持 72+ 個內(nèi)核,每個 CPU 有 117MB 的總 L3 緩存。英偉達(dá)表示,上面圖片中的第一個方框圖是“出于說明目的的可能拓?fù)浣Y(jié)構(gòu)”,其對齊方式與第二個方框圖不完全一致。

此圖顯示了具有8個SCF緩存分區(qū)(SCC)的芯片,這些分區(qū)看起來是L3緩存片以及8個CPU單元。SCC 和內(nèi)核以兩個一組連接到緩存交換節(jié)點(diǎn) (CSN),然后 CSN 駐留在 SCF 網(wǎng)狀結(jié)構(gòu)上,以提供CPU核心和芯片其余部分的存儲器之間的接口。SCF 還通過 Coherent NVLink 支持多達(dá)四個插槽的一致性。

103d07a4-2070-11ed-ba43-dac502259ad0.png

英偉達(dá)還分享了上圖,顯示每個Grace CPU支持多達(dá)68個PCIe通道和多達(dá)4個PCIe 5.0 x16連接。每個x16連接支持高達(dá)128 GB/s的雙向吞吐量(x16鏈路可以分成兩個x8鏈路),還有16個雙通道LPDDR5X內(nèi)存控制器(MC)。然而,這張圖與第一張圖不同——它將 L3 緩存顯示為連接到四核 CPU 集群的兩個連續(xù)塊,這比之前的圖更有意義,芯片中總共有 72 個內(nèi)核。但是,我我們在第一張圖中沒有看到單獨(dú)的SCF分區(qū)或CSN節(jié)點(diǎn)。

英偉達(dá)官方表示,Scalable Coherency Fabric (SCF) 是其專有設(shè)計,但 Arm 允許其合作伙伴通過調(diào)整核心數(shù)量、緩存大小和使用不同類型的內(nèi)存(如 DDR5 和 HBM)來定制 CMN-700 網(wǎng)格,以及選擇各種接口,如 PCIe 5.0、CXL 和 CCIX。這意味著 英偉達(dá)有可能為片上結(jié)構(gòu)使用高度定制的 CMN-700 實(shí)現(xiàn)。

英偉達(dá)Grace Hopper 擴(kuò)展 GPU 內(nèi)存

GPU 需要高的內(nèi)存吞吐量,因此,英偉達(dá)將目光轉(zhuǎn)向提高內(nèi)存吞吐量,不僅是芯片內(nèi)部,還包括CPU和GPU之間。Grace CPU 有 16 個雙通道 LPDDR5X 內(nèi)存控制器,最多可支持 32 個通道,支持高達(dá) 512 GB 的內(nèi)存和高達(dá) 546 GB/s 的吞吐量。英偉達(dá)表示,由于容量和成本等多種因素,它選擇了 LPDDR5X 而不是 HBM2e。同時,與標(biāo)準(zhǔn) DDR5 內(nèi)存相比,LPDDR5X 提供了 53% 的帶寬和 1/8 的每 GB 功耗,使其成為更好的選擇。

英偉達(dá)還推出了擴(kuò)展 GPU 內(nèi)存 (EGM),它允許 NVLink 網(wǎng)絡(luò)上的任何 Hopper GPU 訪問網(wǎng)絡(luò)上任何 Grace CPU 的 LPDDR5X 內(nèi)存。

英偉達(dá)的目標(biāo)是提供一個統(tǒng)一的內(nèi)存池,可以在 CPU 和 GPU 之間共享,從而在簡化編程模型的同時提供更高的性能。Grace Hopper CPU+GPU 芯片支持具有共享頁表的統(tǒng)一內(nèi)存,這意味著芯片可以與 CUDA 應(yīng)用程序共享地址空間和頁表,并允許使用系統(tǒng)分配器來分配 GPU 內(nèi)存。

英偉達(dá)NVLink-C2C

CPU 內(nèi)核是計算引擎,但互連是決定計算未來的戰(zhàn)場。移動數(shù)據(jù)比實(shí)際計算數(shù)據(jù)消耗更多的能量,因此更快、更有效地移動數(shù)據(jù),甚至避免數(shù)據(jù)傳輸,是一個關(guān)鍵目標(biāo)。

英偉達(dá)的Grace CPU由一塊板上的兩個 CPU 組成,而 Grace Hopper Superchip 則由同一塊板上的一個 Grace CPU 和一個 Hopper GPU 組成,旨在通過專有的NVLink芯片到芯片(C2C)互連最大化單元之間的數(shù)據(jù)傳輸,并提供一致性內(nèi)存,以減少或消除數(shù)據(jù)傳輸。

106865fc-2070-11ed-ba43-dac502259ad0.png

英偉達(dá)分享了有關(guān)其 NVLink-C2C 互連的新細(xì)節(jié),這是一種支持內(nèi)存一致性的芯片到芯片和芯片到芯片互連,可提供高達(dá) 900 GB/s 的吞吐量(是 PCIe 5.0 x16 鏈路帶寬的 7 倍)。該接口使用 NVLink 協(xié)議,英偉達(dá)使用其 SERDES 和 LINK 設(shè)計技術(shù)精心設(shè)計了該接口,重點(diǎn)關(guān)注能源和面積效率。NVLink-C2C 也支持行業(yè)標(biāo)準(zhǔn)協(xié)議,如 CXL 和 Arm 的 AMBA 相干集線器接口(CHI — Neoverse CMN-700 網(wǎng)格的CHI-key)。它還支持多種類型的連接,從基于PCB的互連到硅中介層和晶圓級實(shí)現(xiàn)。

功率效率是所有數(shù)據(jù)結(jié)構(gòu)的一個關(guān)鍵指標(biāo),如今,英偉達(dá)共享鏈路傳輸?shù)臄?shù)據(jù)每比特消耗1.3微微焦耳(pJ/b)。這是 PCIe 5.0 接口效率的 5 倍,但它是未來將上市的 UCIe 互連(0.5 到 0.25 pJ/b)功率的兩倍多。封裝類型各不相同,C2C link為 英偉達(dá)提供了性能和效率的完美結(jié)合,以滿足其特定的使用情況。

英偉達(dá)Grace CPU 基準(zhǔn)測試

1093537a-2070-11ed-ba43-dac502259ad0.png

10bad5f8-2070-11ed-ba43-dac502259ad0.png

10caddcc-2070-11ed-ba43-dac502259ad0.png

英偉達(dá)的新基準(zhǔn)是SpecIntRate 2017基準(zhǔn)中單臺Grace CPU的370分。這英偉達(dá)已經(jīng)共享了一個多CPU基準(zhǔn),在SPECTINTRATE2017基準(zhǔn)中,兩個Grace CPU的得分為740。顯然,這表明兩個芯片的線性縮放改進(jìn)。

AMD目前的第二代EPYC Milan芯片是數(shù)據(jù)中心目前的性能領(lǐng)導(dǎo)者,發(fā)布的規(guī)格結(jié)果從382到424片不等,這意味著高端x86芯片仍將保持領(lǐng)先地位。然而,英偉達(dá)的解決方案將具有許多其他優(yōu)勢,如功率效率和更GPU友好的設(shè)計。

英偉達(dá)分享了其內(nèi)存吞吐量基準(zhǔn),表明Grace CPU在CPU內(nèi)存吞吐量測試中可以提供約500 GB/s的吞吐量。英偉達(dá)還聲稱,該芯片還可以將高達(dá)506Gb/s的組合讀/寫吞吐量推送到連接的Hopper GPU,并在讀吞吐量測試期間將CPU到GPU的帶寬計時為429Gb/s,在寫入時為407Gb/秒。

Grace Hopper ARM系統(tǒng)準(zhǔn)備好了嗎?

英偉達(dá)還宣布 Grace CPU Superchip 將遵守獲得 System Ready 認(rèn)證的必要要求。以獲得系統(tǒng)就緒認(rèn)證。該認(rèn)證意味著Arm芯片將與操作系統(tǒng)和軟件一起“正常工作”,從而簡化部署。Grace 還將支持虛擬化擴(kuò)展,包括嵌套虛擬化和 S-EL2 支持。英偉達(dá)還列出了對以下內(nèi)容的支持:

nRAS v1.1 通用中斷控制器 (GIC) v4.1

n內(nèi)存分區(qū)和監(jiān)控 (MPAM)

n系統(tǒng)內(nèi)存管理單元 (SMMU) v3.1

nArm 服務(wù)器基礎(chǔ)系統(tǒng)架構(gòu) (SBSA) 可實(shí)現(xiàn)符合標(biāo)準(zhǔn)的硬件和軟件接口

此外,為了在基于 Grace CPU 的系統(tǒng)上啟用標(biāo)準(zhǔn)引導(dǎo)流程,Grace CPU被設(shè)計為支持Arm服務(wù)器基本引導(dǎo)要求(SBBR)。

對于緩存和帶寬分區(qū)以及帶寬監(jiān)控,Grace CPU還支持Arm內(nèi)存分區(qū)和監(jiān)控(MPAM)。Grace CPU 還包括 Arm 性能監(jiān)控單元,允許對 CPU 內(nèi)核以及片上系統(tǒng) (SoC) 架構(gòu)中的其他子系統(tǒng)進(jìn)行性能監(jiān)控。這使得標(biāo)準(zhǔn)工具(例如 Linux perf)能夠用于性能調(diào)查。英偉達(dá)的 Grace CPU 和 Grace Hopper Superchip 有望在 2023 年初發(fā)布,其中 Hopper 變體適用于 AI 訓(xùn)練、推理和 HPC,而雙 CPU Grace 系統(tǒng)則專為 HPC 和云計算工作負(fù)載而設(shè)計。

審核編輯 :李倩

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • cpu
    cpu
    +關(guān)注

    關(guān)注

    68

    文章

    11229

    瀏覽量

    223225
  • 架構(gòu)
    +關(guān)注

    關(guān)注

    1

    文章

    532

    瀏覽量

    26521
  • 英偉達(dá)
    +關(guān)注

    關(guān)注

    23

    文章

    4048

    瀏覽量

    97871

原文標(biāo)題:詳解英偉達(dá)Grace Hopper CPU 超級芯片設(shè)計

文章出處:【微信號:ICViews,微信公眾號:半導(dǎo)體產(chǎn)業(yè)縱橫】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點(diǎn)推薦

    RV生態(tài)又一里程碑:英偉達(dá)官宣CUDA將兼容RISC-V架構(gòu)!

    電子發(fā)燒友網(wǎng)報道(文/梁浩斌)英偉達(dá)生態(tài)護(hù)城河CUDA,從最初支持x86、Power?CPU架構(gòu),到2019年宣布支持Arm?CPU,不斷拓展在數(shù)據(jù)中心的應(yīng)用生態(tài)。 在2019年至今的
    的頭像 發(fā)表于 07-19 00:04 ?6221次閱讀
    RV生態(tài)又一里程碑:<b class='flag-5'>英偉</b>達(dá)官宣CUDA將兼容RISC-V<b class='flag-5'>架構(gòu)</b>!

    英偉達(dá)發(fā)布 NVQLink 開放系統(tǒng)架構(gòu);國內(nèi)首個汽車芯片標(biāo)準(zhǔn)驗(yàn)證平臺投入使用

    英偉達(dá)發(fā)布 NVQLink 開放系統(tǒng)架構(gòu) 在華盛頓特區(qū)舉行的英偉達(dá)全球技術(shù)大會上,英偉
    發(fā)表于 10-29 10:33 ?1044次閱讀

    英偉達(dá)加速800V HVDC架構(gòu)落地,三家本土企業(yè)打入供應(yīng)鏈!

    電子發(fā)燒友網(wǎng)報道(文/梁浩斌)在今年5月份的COMPUTEX 2025上,英偉達(dá)宣布將推動數(shù)據(jù)中心電源架構(gòu)往800V DC發(fā)展,為未來千兆瓦級數(shù)據(jù)中心提供電力支持,并公布了一系列合作伙伴名單。而剛剛
    的頭像 發(fā)表于 10-15 09:15 ?1.2w次閱讀
    <b class='flag-5'>英偉</b><b class='flag-5'>達(dá)</b>加速800V HVDC<b class='flag-5'>架構(gòu)</b>落地,三家本土企業(yè)打入供應(yīng)鏈!

    英偉達(dá)最新B30A芯片曝光:算力角逐中的新變數(shù)

    目前允許在中國銷售的H20型號。這一消息瞬間點(diǎn)燃了行業(yè)內(nèi)外的關(guān)注熱情,為本就競爭激烈的AI芯片領(lǐng)域增添了新的變數(shù)。 ? 架構(gòu)升級:站在巨人肩膀上的革新 B30A芯片將基于英偉達(dá)去年GTC大會上發(fā)布的新一代計算
    的頭像 發(fā)表于 08-22 16:41 ?1265次閱讀

    英偉達(dá)自研HBM基礎(chǔ)裸片

    CPU直接連接。 ? 英偉達(dá)可能會在2027年上半年首先采用SK海力士供應(yīng)的標(biāo)準(zhǔn)HBM4E,然后從2027年下
    的頭像 發(fā)表于 08-21 08:16 ?2570次閱讀

    英偉達(dá):CUDA 已經(jīng)開始移植到 RISC-V 架構(gòu)

    ,著重介紹了將 CUDA 移植到 RISC-V 架構(gòu)的相關(guān)工作和計劃,展現(xiàn)了對 RISC-V 架構(gòu)的高度重視與積極布局。 ? Frans Sijstermanns 首先回顧了英偉達(dá)
    發(fā)表于 07-17 16:30 ?3861次閱讀

    NVIDIA Grace CPU C1獲得廣泛支持

    NVIDIA 在本周 COMPUTEX 上重點(diǎn)展示了其全新的 Grace CPU C1,并獲得多家主要原始設(shè)計制造商合作伙伴的大力支持。
    的頭像 發(fā)表于 05-22 10:01 ?642次閱讀

    IBM攜手英偉達(dá)AI數(shù)據(jù)平臺推動企業(yè)級AI創(chuàng)新

    近日,IBM(紐約證券交易所:IBM)宣布與英偉達(dá)(納斯達(dá)克股票代碼:NVDA)開展全新合作,雙方將基于英偉達(dá) AI 數(shù)據(jù)平臺參考架構(gòu)(re
    發(fā)表于 03-24 19:20 ?431次閱讀

    新思科技攜手英偉達(dá)加速芯片設(shè)計,提升芯片電子設(shè)計自動化效率

    宣布在英偉達(dá) Grace Blackwell 平臺上實(shí)現(xiàn)高達(dá) 30 倍的預(yù)期性能提升,加速下一代半導(dǎo)體的電路仿真 ? 摘要: 在今年GTC主題演講中,新思科技作為生態(tài)系統(tǒng)的一部分,展示了全棧EDA
    發(fā)表于 03-19 17:59 ?453次閱讀

    新思科技亮相英偉達(dá)GTC 2025大會

    為了實(shí)現(xiàn)這一速度提升,新思科技在GTC全球AI大會上宣布,正在使用英偉達(dá) CUDA-X庫優(yōu)化其下一代半導(dǎo)體開發(fā)解決方案。公司還在擴(kuò)大對英偉達(dá)Grac
    的頭像 發(fā)表于 03-19 17:53 ?1150次閱讀

    英偉達(dá)市值一夜蒸發(fā)近2萬億 英偉達(dá)股價下跌超8%

    在美東時間周一,美股三大指數(shù)集體收跌,截至收盤,英偉達(dá)股價下跌超8%,英偉達(dá)市值一夜蒸發(fā)2650億美元(換算下來約合人民幣19345億元);目前英偉
    的頭像 發(fā)表于 03-04 10:19 ?1014次閱讀

    英偉達(dá)A100和H100比較

    英偉達(dá)A100和H100都是針對高性能計算和人工智能任務(wù)設(shè)計的GPU,但在性能和特性上存在顯著差異。以下是對這兩款GPU的比較: 1. 架構(gòu)與核心規(guī)格: A100: 架構(gòu): 基于Amp
    的頭像 發(fā)表于 02-10 17:05 ?1.2w次閱讀
    <b class='flag-5'>英偉</b><b class='flag-5'>達(dá)</b>A100和H100比較

    郭明錤:英偉達(dá)將降低CoWoS-S封裝需求

    近日,天風(fēng)證券知名分析師郭明錤在其個人博文中,針對英偉達(dá)最新調(diào)整的Blackwell架構(gòu)藍(lán)圖,提出了自己的見解。 郭明錤指出,根據(jù)英偉達(dá)的最
    的頭像 發(fā)表于 01-16 15:03 ?841次閱讀

    英偉達(dá)大幅削減臺積電和聯(lián)電CoWoS訂單

    的原因主要有三個:一是Hopper平臺芯片已經(jīng)停產(chǎn),導(dǎo)致相關(guān)需求銳減;二是最新推出的GB200A芯片市場需求有限,未能達(dá)到預(yù)期的銷售目標(biāo);三是GB300A芯片的市場需求也相對緩慢,進(jìn)一步影響了英偉達(dá)的整體訂單量。 據(jù)悉,
    的頭像 發(fā)表于 01-16 14:39 ?987次閱讀

    英偉達(dá)Blackwell芯片機(jī)架出現(xiàn)故障 訂單下滑

    Blackwell GB200機(jī)架訂單。 一些客戶正在等待改進(jìn)版本的機(jī)架,或者計劃購買該公司舊款的AI芯片。 微軟最初計劃在其位于鳳凰城的一家工廠中安裝至少5萬塊Blackwell芯片的GB200機(jī)架,但由于出現(xiàn)延誤,微軟的關(guān)鍵合作伙伴OpenAI要求微軟為其提供英偉達(dá)
    的頭像 發(fā)表于 01-14 15:39 ?686次閱讀