獨家求證后獲知的信息。" />

chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

獨家解讀NVIDIA CUDA支持Arm——百萬兆級超算競爭再加劇?

張慧娟 ? 來源:電子發(fā)燒友網(wǎng) ? 作者:張慧娟 ? 2019-06-18 03:19 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群


在法蘭克福舉辦的全球超級計算大會上,重磅消息傳來,NVIDIA宣布CUDA支持Arm CPU,為高性能計算開辟全新途徑,以構(gòu)建具有極高能效水平的百萬兆級AI超級計算機。北京時間6月17日下午四點,NVIDIA與媒體召開電話會議。下文將詳解雙方合作始末,以及<電子發(fā)燒友>獨家求證后獲知的信息。

NVIDIA攜手Arm意欲何在?

隨著傳統(tǒng)計算規(guī)模擴展步伐的停止,功率將成為所有超級計算機的限制因素。對于與Arm的攜手,NVIDIA創(chuàng)始人兼首席執(zhí)行官黃仁勛表示:“NVIDIA CUDA加速的計算和Arm的高能效CPU架構(gòu)的相結(jié)合,將助力HPC社區(qū)實現(xiàn)大幅提升,以達到百萬兆級?!?br />
雙方合作的原因主要有兩方面:首先,客戶需要更多選擇,一旦完成堆棧優(yōu)化,Nvidia將加速所有主要CPU架構(gòu),包括x86、Power和ARM;其次,通過將NVIDIA軟件棧引入Arm生態(tài)系統(tǒng),將進一步助推在HPC服務(wù)器市場的創(chuàng)新。

年底前,NVIDIA將向Arm生態(tài)系統(tǒng)提供全堆棧的AI和HPC軟件,該堆棧為600多個HPC應(yīng)用程序和所有AI框架提供加速,其中包括了所有NVIDIA CUDA-X AI和HPC庫、GPU加速的AI框架和軟件開發(fā)工具,如支持OpenACC的PGI編譯器和性能分析器。

NVIDIA解決方案架構(gòu)與工程團隊副總裁Marc Hamilton透露,NVIDIA和Arm已為這個計劃準備了兩年左右,認為現(xiàn)在是最佳的發(fā)布時機。建立在雙方超過10年的合作基礎(chǔ)之上,此前,NVIDIA幾款用于便攜式游戲、自動駕駛汽車、機器人嵌入式AI計算的系統(tǒng)級芯片產(chǎn)品都采用了Arm。全球眾多涉及超級計算的項目或單位都在尋求Arm的加入,包括歐洲處理器計劃(European Processor Initiative)、日本先進情報項目中心 (RIKEN)、美國能源部的先鋒項目(DOE Vanguard project)等。

合作僅止于HPC軟件方面?還是會進一步影響到某些應(yīng)用市場?NVIDIA表示,合作同時也是對于其他平臺的補充,例如Jetson Xavier,并將進一步拓展在數(shù)據(jù)中心和HPC平臺的合作。

超算競爭再加劇

在超級計算機中使用基于Arm的體系結(jié)構(gòu)是值得注意的,和其他架構(gòu)相比,Arm的一大特色在于出色的能效,能夠為超級計算提供開放式架構(gòu),用戶可以實現(xiàn)更為高度的集成。對于需要快速處理和分析大型數(shù)據(jù)集的研究密集型任務(wù),能夠滿足內(nèi)存容量和可擴展性需求。

Arm已經(jīng)在世界各地的許多HPC中心獲得了越來越多的關(guān)注,NVIDIA支持Arm CPU后,將為研發(fā)超算的研究人員們提供了除英特爾和IBM外的第三種選擇,并使得研發(fā)者可以通過這種方式獲得更多的自主控制能力。對于已經(jīng)選擇了Arm CPU的用戶來說,他們同時可以獲得NVIDIA GPU加速計算選項。CUDA強大的軟件能力,將能夠和Arm的軟件生態(tài)無縫銜接,強強聯(lián)合。

一直以來,Arm并沒有放棄將其處理器擴展至高性能計算領(lǐng)域的堅持。近年來大的舉動有:2016年8月宣布將與日本富士通公司合作,開發(fā)一個以64位ARMv8-A驅(qū)動的Post K超級計算機,并于當年12月宣布收購Allinea Software公司,后者主要為超級計算機提供性能分析工具。在2018年11月的TOP500列表上,首次出現(xiàn)了Arm的身影,而且是安裝在大名鼎鼎的美國桑迪亞國家實驗室。與此同時,Cray于2018年11月在英國氣象局交付了一臺基于Arm的超級計算機"Isambard",而日本的下一代超級計算機"Post-K"也同樣基于Arm架構(gòu)。

超算未來將更為注重能耗

超算屆有兩個重要排名:TOP500和Green500。TOP500主要按照性能基準,提供通用高端應(yīng)用的系統(tǒng)排名。而相比TOP500,Green500除了追求運算速度,更加重視超算的能耗問題。

根據(jù)今年剛剛發(fā)布的Green500排行榜,在全球最節(jié)能的25款超級計算機中,有22款都得益于NVIDIA的支持。關(guān)鍵因素在于:采用NVIDIA GPU的超級計算機能夠?qū)⒎敝氐奶幚碜鳂I(yè)卸載至更為節(jié)能的并行處理CUDA GPU之上;NVIDIA與Mellanox合作優(yōu)化整體超級計算集群的處理;以及NVIDIA發(fā)明的SXM 3D封裝和可實現(xiàn)極密集型擴展節(jié)點的NVIDIA NVLink互連技術(shù)。

攜手打造超豪華“朋友圈”

包括超算中心和系統(tǒng)提供商以及系統(tǒng)級芯片制造商等在內(nèi)的眾多HPC行業(yè)及Arm生態(tài)系統(tǒng)中的全球領(lǐng)先企業(yè),都表達了其對于NVIDIA攜手Arm的支持。

對于超算百萬兆級時代的愿景,Cray認為主要在于將AI和分析與建模、仿真相結(jié)合的系統(tǒng),這些系統(tǒng)能夠支持、也經(jīng)常需要為科學(xué)、工程和數(shù)字化轉(zhuǎn)型所需的數(shù)據(jù)密集型工作負載構(gòu)建的多種處理器架構(gòu)和系統(tǒng)。Cray系統(tǒng)管理和編程環(huán)境(編譯器、庫和工具)已經(jīng)能夠在XC和未來的Shasta超級計算機上支持Arm處理器,將CUDA和CUDA-X HPC和AI軟件堆棧用于Arm平臺,并將其與Cray系統(tǒng)管理和編程環(huán)境緊密集成,能夠助力其超級計算機實現(xiàn)最終愿景。

“歐洲處理器計劃(European Processor Initiative,EPI)總經(jīng)理Philippe Notton則表示,打造歐盟自己的高端、低功耗、通用和加速器解決方案,EPI和其工業(yè)合作伙伴SiPearl非??春肗VIDIA所帶來的全新可能性。將EPI基于Arm的微處理器與NVIDIA加速器相結(jié)合,能夠匹配未來歐洲百萬兆級模塊化超級計算機中的構(gòu)建模塊?!?br />
考慮到未來幾年內(nèi)百萬兆級系統(tǒng)和大規(guī)模AI計算的興起,Jülich超算中心負責人Thomas Lippert表示, NVIDIA對Arm處理器的支持是非常令人興奮的發(fā)展,對于實現(xiàn)未來超級計算機和可組合數(shù)據(jù)中心的真正模塊化至關(guān)重要。

在HPC網(wǎng)絡(luò)方面處于領(lǐng)先地位的Mellanox Technologies,其InfiniBand和以太網(wǎng)技術(shù)連接了全球多款大型的超級計算機,其中就包括第一代基于Arm的各系統(tǒng)。該公司創(chuàng)始人兼首席執(zhí)行官Eyal Waldman希望通過持續(xù)合作,部署200Gb/s HDR和計算網(wǎng)絡(luò)技術(shù),以優(yōu)化HPC和AI工作負載,并實現(xiàn)新一代基于Arm的超級計算機的超級連接。

百萬兆級意義何在?

全球超級計算機競賽正朝著“百萬兆級計算”這個里程碑似的目標前進著。

百萬兆級意味著什么?一個百萬兆級的計算機一瞬間進行的計算量,相當于地球上所有人每天每秒都不停地計算四年。

這種非凡的力量將使研究人員能夠進行大規(guī)模復(fù)雜的模擬,從而在許多領(lǐng)域取得進展,從氣候科學(xué)到基因組學(xué)、可再生能源和人工智能。田納西大學(xué)的超級計算機專家Jack Dongarra曾說過:“百萬兆級的計算機是一項有力的科學(xué)工具,就像粒子對撞機或巨型望遠鏡一樣?!边@些機器在工業(yè)上也很有用,它們可以被用于加速產(chǎn)品設(shè)計和識別新材料。軍方和情報機構(gòu)也渴望這樣的超級計算機能夠?qū)⒈挥糜诰S護國家安全。超級計算機是促進科學(xué)發(fā)現(xiàn)的重要工具,建立百萬兆級超級計算將能夠極大地擴展人類知識的邊界。


聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • ARM
    ARM
    +關(guān)注

    關(guān)注

    135

    文章

    9553

    瀏覽量

    391912
  • NVIDIA
    +關(guān)注

    關(guān)注

    14

    文章

    5594

    瀏覽量

    109754
  • 超級計算
    +關(guān)注

    關(guān)注

    1

    文章

    45

    瀏覽量

    11555
  • HPC
    HPC
    +關(guān)注

    關(guān)注

    0

    文章

    346

    瀏覽量

    24979
  • CUDA
    +關(guān)注

    關(guān)注

    0

    文章

    127

    瀏覽量

    14475
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    借助NVIDIA CUDA Tile IR后端推進OpenAI Triton的GPU編程

    NVIDIA CUDA Tile 是基于 GPU 的編程模型,其設(shè)計目標是為 NVIDIA Tensor Cores 提供可移植性,從而釋放 GPU 的極限性能。CUDA Tile 的
    的頭像 發(fā)表于 02-10 10:31 ?245次閱讀

    如何在NVIDIA CUDA Tile中編寫高性能矩陣乘法

    本博文是系列課程的一部分,旨在幫助開發(fā)者學(xué)習(xí) NVIDIA CUDA Tile 編程,掌握構(gòu)建高性能 GPU 內(nèi)核的方法,并以矩陣乘法作為核心示例。
    的頭像 發(fā)表于 01-22 16:43 ?4833次閱讀
    如何在<b class='flag-5'>NVIDIA</b> <b class='flag-5'>CUDA</b> Tile中編寫高性能矩陣乘法

    NVIDIA CUDA Tile的創(chuàng)新之處、工作原理以及使用方法

    NVIDIA CUDA 13.1 推出 NVIDIA CUDA Tile,這是自 2006 年 NVIDIA
    的頭像 發(fā)表于 12-24 10:17 ?474次閱讀
    <b class='flag-5'>NVIDIA</b> <b class='flag-5'>CUDA</b> Tile的創(chuàng)新之處、工作原理以及使用方法

    在Python中借助NVIDIA CUDA Tile簡化GPU編程

    NVIDIA CUDA 13.1 版本新增了基于 Tile 的GPU 編程模式。它是自 CUDA 發(fā)明以來 GPU 編程最核心的更新之一。借助 GPU tile kernels,可以用比 SIMT
    的頭像 發(fā)表于 12-13 10:12 ?1203次閱讀
    在Python中借助<b class='flag-5'>NVIDIA</b> <b class='flag-5'>CUDA</b> Tile簡化GPU編程

    NVIDIA CUDA 13.1版本的新增功能與改進

    NVIDIA CUDA 13.1 是自 CUDA 二十年前發(fā)明以來,規(guī)模最大、內(nèi)容最全面的一次更新。
    的頭像 發(fā)表于 12-13 10:08 ?2209次閱讀

    NVIDIA在Hot Chips 2025大會展示創(chuàng)新技術(shù)

    本周在加利福尼亞州帕洛阿爾托(Palo Alto)舉行的 Hot Chips 大會上,NVIDIA 專家詳細介紹了 NVIDIA NVLink 和Spectrum-X 以太網(wǎng)技術(shù)、Blackwell 以及 CUDA 如何為全球數(shù)
    的頭像 發(fā)表于 08-27 12:52 ?1924次閱讀

    AI MCU#易創(chuàng)新GD32H7系列MCU解讀

    易創(chuàng)新GD32H7系列MCU是中國首款基于Arm? Cortex?-M7內(nèi)核的超高性能微控制器,主打高力與多場景適配能力,以下從核心特性應(yīng)用場景及開發(fā)生態(tài)三方面深度解析: 一核心性能與架構(gòu)
    的頭像 發(fā)表于 06-27 14:43 ?3521次閱讀

    軟通智完成A輪融資,加速AI力產(chǎn)業(yè)布局

    北京 2025年6月18日 /美通社/ -- 近日,軟通動力旗下軟通智科技(廣東)集團有限公司(以下簡稱"軟通智")完成A輪融資,本輪融資由盛景嘉成創(chuàng)投領(lǐng)投,廣發(fā)信德、毅達資
    的頭像 發(fā)表于 06-18 15:37 ?577次閱讀

    NVIDIA B30芯片的核心解讀

    以下是關(guān)于NVIDIA B30芯片的核心解讀,綜合最新行業(yè)信息與分析: 一、 產(chǎn)品定位:中國特供的“精準閹割版”? ? ? 設(shè)計目標 ? 專為中國市場定制,旨在規(guī)避美國出口管制(如H20芯片被禁
    的頭像 發(fā)表于 06-05 14:44 ?3440次閱讀

    Arm 公司面向 PC 市場的 ?Arm Niva? 深度解讀

    面向 PC 市場的 ? Arm Niva ? 深度解讀 ? Arm Niva ? 是 Arm 公司為 PC 市場推出的核心計算平臺,屬于其“平臺優(yōu)先”戰(zhàn)略的關(guān)鍵布局。作為 ?
    的頭像 發(fā)表于 05-29 09:56 ?1637次閱讀

    Arm 公司面向汽車市場的 ?Arm Zena? 深度解讀

    面向汽車市場的 ? Arm Zena ? 深度解讀 Arm Zena 是 Arm 公司面向智能汽車領(lǐng)域推出的核心計算平臺,屬于其“平臺優(yōu)先”戰(zhàn)略的關(guān)鍵布局。作為
    的頭像 發(fā)表于 05-29 09:51 ?2472次閱讀

    華為全液冷充技術(shù)深度解讀

    一、華為全液冷充技術(shù)深度解讀 1. 技術(shù)定義與核心參數(shù) 華為全液冷
    的頭像 發(fā)表于 04-24 11:37 ?8950次閱讀
    華為全液冷<b class='flag-5'>兆</b>瓦<b class='flag-5'>級</b><b class='flag-5'>超</b>充技術(shù)深度<b class='flag-5'>解讀</b>

    充已來,40kW模塊急需升級

    電子發(fā)燒友網(wǎng)報道(文/梁浩斌)比亞迪的充,引爆了充電樁行業(yè),1000kW充電功率的車型落地,將帶動充電樁加速導(dǎo)入市場。除了比亞迪之外,近期行業(yè)內(nèi)其實也有不少
    的頭像 發(fā)表于 04-13 00:02 ?3212次閱讀

    TASKING編譯器全面支持易創(chuàng)新GD32A7x車規(guī)MCU

    近日,易創(chuàng)新 GD32A7x 車規(guī) MCU 正式獲得 TASKING VX-toolset for Arm v7.1r1 的全面支持。作為業(yè)內(nèi)領(lǐng)先的嵌入式開發(fā)工具,TASKING
    的頭像 發(fā)表于 04-12 14:31 ?1455次閱讀

    使用NVIDIA CUDA-X庫加速科學(xué)和工程發(fā)展

    NVIDIA GTC 全球 AI 大會上宣布,開發(fā)者現(xiàn)在可以通過 CUDA-X 與新一代超級芯片架構(gòu)的協(xié)同,實現(xiàn) CPU 和 GPU 資源間深度自動化整合與調(diào)度,相較于傳統(tǒng)加速計算架構(gòu),該技術(shù)可使計算工程工具運行速度提升至原來的 11 倍,計算規(guī)模增加至 5 倍。
    的頭像 發(fā)表于 03-25 15:11 ?1537次閱讀