chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

英偉達:更強的GPU,更快的AI超算

ss ? 來源:阿明觀察 ? 作者:阿明觀察 ? 2020-11-19 18:00 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

在談英偉達的大戰(zhàn)略之前,明確兩個重要事件:

英偉達NVIDIA在2019年3月公開以69億美元現金收購Mellanox,該項交易最終在2020年4月塵埃落定。

英偉達NVIDIA在2020年9月宣布以400億美元現金加股票的方式,對軟銀旗下芯片設計公司、全球重要芯片架構提供商Arm進行收購。

這兩件事情的成功,為英偉達在芯片領域的發(fā)展帶來了更深入、更廣泛的發(fā)展前景,以及更為利好的影響。從資本市場的表現就可見一斑,按周一美東時間11月16日16:00收盤時的價格計算,英偉達的總市值為3335.56億美元,幾乎快超過某友商市值的兩倍。友商名字不方便公布,大家可以猜猜看。

前些天業(yè)內朋友感嘆,這一年,過得太快了。其實,我更想感嘆,英偉達的市值飆升得太快了。

但這市值增長的背后,卻暗藏著英偉達的更大圖謀:超算大戰(zhàn)略。

根據最新的TOP500榜單排名顯示,英偉達全面領先,無論是針對超算領域的計算、網絡還是HPC。

事實上,NVIDIA GPU和網絡正在越來越多地用于加速世界上最快的超級計算機。

一是,基于NVIDIA技術構建的超算系統占比絕對領先,包括8個TOP10超算系統在內,近70%進入TOP500榜單的超算系統都基于NVIDIA技術構建。

二是,NVIDIA Selene超級計算機(HPC)在全球超級計算機速度排行中位列第五。該超級計算機基于NVIDIA DGX A100 640GB系統和NVIDIA Mellanox InfiniBand網絡構建。

三是,在衡量系統能源效率的Green500榜單中,NVIDIA DGX SuperPOD系統位居榜首,得到業(yè)界一致肯定。

從SC20(Supercomputing Conference)超算大會公布的最新TOP500榜單可以看出,英偉達的超算大戰(zhàn)略勢在必得,將在強化現有技術能力部署的前提下,明確了下一步戰(zhàn)略的“三駕馬車”:GPU更強、HPC更快、網絡更優(yōu)。面向超算領域,英偉達的戰(zhàn)略很明確,一點兒都不用含糊,更強更快更優(yōu),也將會是其長期屹立超算領域的制勝法寶。

更強:GPU一路高歌猛進

在超算行業(yè),強中自有強中手。作為超算領域最佳加持者,英偉達在GPU這條發(fā)展路上,可謂一路高歌猛進。

AI算力的強大,再一次彰顯了英偉達整體超算戰(zhàn)略的英明。似乎,這也是英偉達命中注定的好趨勢,誰叫AI行業(yè)化,行業(yè)AI化的智能化時代來得如此之快呢。

針對數據中心GPU需求來看,英偉達以A100、A40、V100、T4、RTX 6000、RTX 8000多款業(yè)界知名的產品系列既已覆蓋。

然而術業(yè)有專攻。針對大流量數據工作負載方面,AI算力的需求特別突出,但是隨著NVIDIA A100 80GB GPU的出現,非常有助于各種訓練、推理和超級計算應用等方面的發(fā)展,在速度和性能上得以前所未有的滿足。

作為英偉達創(chuàng)始人、現任CEO黃仁勛親手推出的GPU力作,A100第一代產品是在幾個月前的英偉達GTC 2020大會上首次亮相的。

因為是基于英偉達安培(Ampere)架構的首款圖形處理器,所以備受業(yè)界關注。當時A100引入了有著里程碑式意義的Tensor Cores雙精度計算技術。要知道以前在NVIDIA V100 Tensor Core GPU上需要10個小時的雙精度模擬作業(yè),在A100上4小時即可完成。

NVIDIA A100 Tensor Core GPU針對AI、數據分析和高性能計算 (HPC)等應用上,實現了更強的加速,針對極其嚴峻的計算挑戰(zhàn)上有了更大作為。A100高效擴展性也很突出,數千個A100 GPU在同一個系統中成功實現集成,也可以利用NVIDIA多實例 GPU (MIG) 技術將每個A100 劃分割為七個獨立的GPU實例,獲得對各種規(guī)模工作負載的加速。

需要注意的是,這里針對HPC性能的對比中,僅限于NVIDIA V100 GPU第一代產品。

A100的出現,對數據中心大規(guī)模的計算帶來了更強的優(yōu)化效果,不僅統一了人工智能訓練和推理,同時將靈活、彈性加速的實現可能性向前又推進一步。

作為A100 GPU系列中的最新力作,A100 80GB GPU在繼承了第一代A100 GPU的優(yōu)勢基礎上,內存比第一代A100 GPU提升一倍,也支持NVIDIA HGX AI超級計算平臺。

大內存容量和高帶寬,對于AI與HPC實際應用的好處有目共睹,畢竟在這個領域中一切都要以速度決勝負。全新A100采用HBM2e技術,可將A100 40GB GPU的高帶寬內存增加一倍至80GB,提供每秒超過2TB的內存帶寬。這使得數據可以快速傳輸到全球最快的數據中心GPU A100上,使研究人員能夠更快地加速其應用,處理最大規(guī)模的模型和數據集。

由此,我們可以很容易看到全新一代的增強A100 80GB GPU在HPC領域的表現更為突出,相比最早一代2016年代表之作P100 GPU,A100 80GB GPU實現了HPC應用性能的11倍提升。

不僅如此,在深度學習、數據分析、能效方面都獲得了前所未有的優(yōu)化。

對于如RNN-T等自動語言識別模型的AI推理,單個A100 80GB MIG實例可處理更大規(guī)模的批量數據,將生產中的推理吞吐量提高1.25倍。

在TB級零售大數據分析基準上,A100 80GB將其性能提高了2倍,使其成為可對最大規(guī)模數據集進行快速分析的理想平臺。隨著數據的動態(tài)更新,企業(yè)可以實時做出關鍵決策。

對于科學應用,A100 80GB可為天氣預報和量子化學等領域提供巨大的加速。材料模擬軟件Quantum Espresso采用單節(jié)點A100 80GB實現了近2倍的吞吐量提升。

從這幾個比較典型的需要大量數據存儲空間的應用來看,A100 80GB GPU在應用性能上確實成為新一代GPU的亮點。由此在架構特性上可以總結為幾點:

一是,采用第三代Tensor Core核心。通過全新TF32,將上一代Volta架構的AI吞吐量提高多達20倍。通過FP64,將HPC性能提高多達2.5倍。通過 INT8,將AI推理性能提高多達20倍,并且支持BF16數據格式。

二是,采用更大、更快的HBM2e GPU內存。從而使內存容量增加一倍,在業(yè)內率先實現2TB/s以上的內存帶寬。

三是,采用MIG技術,將單個獨立實例的內存增加一倍,可最多提供七個MIG,每個實例具備10GB內存。

四是,采用結構化稀疏技術,將推理稀疏模型的速度提高兩倍。

五是,第三代NVLink和NVSwitch,相較于上一代互連技術,可使GPU之間的帶寬增加至原來的兩倍,將數據密集型工作負載的GPU數據傳輸速度提高至每秒600 gigabytes。

AI能力的強大,表現在GPU產品的推陳出新,以及GPU為行業(yè)應用帶來革命性的改變。這就是英偉達的過人之處,好技術帶來行業(yè)改變和產業(yè)格局變化。

更智即更強。由此而言,對于超算行業(yè)的發(fā)展來說,更智能也就自然表現得更為強大了。

更快:HPC沒有最快只有更快

超算的核心在于快,競爭的價值在于更快。在超算領域只有在超算系統上實現更快的速度,才能實現超算系統整體能力的更強。

作為強化AI算力的全球領先廠商,英偉達新一代DGX Station A100和DGX A100 640GB移動數據中心引起了我特別的注意,這也是在 SC20超級計算大會上與A100 80GB GPU同期發(fā)布的重量級產品。

DGX Station A100的AI性能可以達到2.5 petaflops,通過NVIDIA NVLink完全互連,實現四個全新NVIDIA A100 80GB GPU融合在一起的工作組服務器,同時GPU內存高達320GB。更為特別是DGX Station A100也是唯一支持NVIDIA多實例GPU技術(MIG)的工作組服務器。借助MIG,單一DGX Station A100最多可提供28個獨立GPU實例以運行并行任務,并可在不影響系統性能的前提下支持多用戶應用。

這也是全球唯一的千萬億級工作組服務器,如此性能超快的DGX Station A100,被業(yè)內稱之為一體式AI數據中心,也就是說,用戶借助一臺DGX Station A100,就可以在任何地方部署AI超算中心了。

如此說來,作為服務器級的系統,DGX Station A100無需配備數據中心級電源或散熱系統,卻具有與NVIDIA DGX A100數據中心系統相同的遠程管理功能。當數據科學家和研究人員在家中或實驗室辦公時,系統管理員可輕松地通過遠程連接,執(zhí)行任何管理任務。

作為一臺隨處可得的AI超級計算機,性能上的突出表現尤為吸引人。為支持諸如BERT Large推理等復雜的對話式AI模型,DGX Station A100比上一代DGX Station提速4倍以上。對于BERT Large AI訓練,其性能提高近3倍。

此外,全新DGX A100 640GB系統也將集成到企業(yè)版NVIDIA DGX SuperPOD解決方案,使機構能基于以20 個DGX A100系統為單位的一站式AI超級計算機,實現大規(guī)模AI模型的構建、訓練和部署。

配備A100 80GB GPU的NVIDIA DGX SuperPOD系統將率先安裝于英國的Cambridge-1超級計算機,以加速推進醫(yī)療健康領域研究,以及佛羅里達大學的全新HiPerGator AI超級計算機,該超級計算機將賦力這一“陽光之州”開展AI賦能的科學發(fā)現。

由此可見,新一代DGX Station A100和DGX A100 640GB移動數據中心的出現,將給AI超級計算機的行業(yè)格局帶來一次新的震動。全球云觀察分析,這有望將超算從傳統超算時代推向真正的智能超算時代,那么英偉達必定就是其中舉足輕重的使能者之一。同時AI超算上的創(chuàng)新也將因為NVIDIA A100 80GB GPU而再次迎來新的發(fā)展,對AI超算的行業(yè)應用普及帶來了更大的發(fā)展?jié)摿εc空間。

更優(yōu):高效網絡性能空前

任何超算系統,離開了高效的網絡,基本上談不上超算??梢娋W絡對于超算系統整體價值的貢獻缺一不可。

為此,英偉達并購Mellanox后,對于InfiniBand高效網絡的性能發(fā)揮得到了空前的提升。

400G InfiniBand系統在之前聽說過業(yè)內傳聞,沒有想到英偉達如今很快變成了現實。“NVIDIA Mellanox 400G InfiniBand的海量吞吐量和智能加速引擎使HPC、AI和超大規(guī)模云基礎設施能夠以更低的成本和復雜性,實現了全球最具挑戰(zhàn)性的網絡互連性能?!?/p>

為了支撐更強更快的AI超算的需要,Mellanox 400G InfiniBand帶來的加速能力也是值得一看。Mellanox NDR 400G InfiniBand交換機,可提供3倍的端口密度和32倍的AI加速能力。并且將框式交換機系統的聚合雙向吞吐量提高了5倍,達到1.64 petabits/s,減少交換機使用量獲得更大工作負載的支撐,必然對用戶整體應用成本帶來更良好的回報。

當然,好的產品,特別是在行業(yè)領域有著技術創(chuàng)新領先性的產品,往往贏得市場的認同更為廣泛。

從一組財報數據來看,英偉達截至2020年7月26日的第二季度財報,營收為38.7億美元,創(chuàng)歷史新高,較去年同期的25.8億美元增長50%,較上一季度的30.8億美元增長26%。

其中有一個關鍵信息就是該季度數據中心方面業(yè)務收入出奇高增長,財報期內為17.5億美元,為2019年同期收入6.55億美元的兩倍多。這也是數據中心領域帶來的收入首次出現超越英偉達成立以來的主營視頻游戲領域業(yè)務,財報期內視頻游戲業(yè)務為16.5億美元。

就此來說,英偉達在數據中心取得高速增長成績,與收購Mellanox有著密切相關。

可見,英偉達Mellanox在高效網絡方面的性能表現,已經贏得了用戶的心聲,特別是在超算領域,英偉達Mellanox的InfiniBand技術一直備受矚目。

小結:AI超算的未來已來

英偉達的超算大戰(zhàn)略,必然就是將AI加入到HPC中,并擴展至傳統超級計算中心之外的平臺,從而引發(fā)了全球AI超算大趨勢。

與此同時,創(chuàng)新效率超高的英偉達,在加速計算領域、HPC、網絡三大領域分別發(fā)布了新一代A100 80GB GPU處理器、新一代DGX StationA100和DGX A100 640GB移動數據中心、Mellanox 400G InfiniBand系統多款重磅新品,可謂三駕馬車并駕齊驅,以應對全球爆發(fā)式增長的數據處理需求和日益凸顯的機器學習需要。這對全球超算整體格局的變化,帶來非常積極的推動作用。

更強的GPU,更快的AI超算,更優(yōu)的高效網絡,也將成為英偉達持續(xù)向前發(fā)展的重要三部曲。

責任編輯:xj

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規(guī)問題,請聯系本站處理。 舉報投訴
  • gpu
    gpu
    +關注

    關注

    28

    文章

    5099

    瀏覽量

    134471
  • NIVIDA
    +關注

    關注

    0

    文章

    9

    瀏覽量

    7276
  • 超算
    +關注

    關注

    1

    文章

    118

    瀏覽量

    9500
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    英偉重磅殺入Arm AI PC,N1X芯片跑分曝光!結果比較意外

    英偉GPU視作圭臬,將英偉AI“賣鏟人”的標簽夯實。 ? 但隨著
    的頭像 發(fā)表于 03-04 00:58 ?3105次閱讀
    <b class='flag-5'>英偉</b><b class='flag-5'>達</b>重磅殺入Arm <b class='flag-5'>AI</b> PC,N1X芯片跑分曝光!結果比較意外

    融資20億,這家“非GPU”芯片公司躋身國產AI力第一梯隊

    電子發(fā)燒友報道(文/黃晶晶)谷歌 TPU 對英偉 GPU 的直接競爭,引發(fā)市場廣泛關注。而如今,中國 AI 芯片領域也正加速布局,發(fā)力非GPU
    的頭像 發(fā)表于 12-04 09:17 ?9678次閱讀
    融資<b class='flag-5'>超</b>20億,這家“非<b class='flag-5'>GPU</b>”芯片公司躋身國產<b class='flag-5'>AI</b><b class='flag-5'>算</b>力第一梯隊

    英偉 Q3 狂攬 308 億

    英偉 2025 財年第三季度交出亮眼成績單,數據中心業(yè)務營收飆至 308 億美元,同比增長 112%,占總銷售額的 88%。這一爆發(fā)式增長,核心源于全球 AI 力需求激增,谷歌、微
    的頭像 發(fā)表于 11-20 18:11 ?1063次閱讀

    黃仁勛:英偉AI芯片訂單排到2026年 英偉上季營收加速增長62%再預期

    AI芯片總龍頭英偉的財報終于帶來了驚喜;英偉公司發(fā)布財報數據顯示,上季營收加速增長62%;再
    的頭像 發(fā)表于 11-20 11:36 ?855次閱讀

    看點:英偉將在韓國部署26萬枚GPU 中國服務器龍頭聚變籌備上市 中芯國際控股公司增資至59.5億美元

    給大家?guī)硪恍I(yè)界新聞: 英偉將在韓國部署26萬枚GPU 據外媒報道,在10月31日,英偉公司宣布將與韓國政府及三星電子、SK集團、現代
    的頭像 發(fā)表于 10-31 11:46 ?363次閱讀

    英偉自研HBM基礎裸片

    "后的下一代AI GPU "Feynman"。 ? 有分析指出,英偉此舉或是將部分GPU功能集成到基礎裸片中,旨在提高HBM和
    的頭像 發(fā)表于 08-21 08:16 ?2531次閱讀

    aicube的n卡gpu索引該如何添加?

    請問有人知道aicube怎樣才能讀取n卡的gpu索引呢,我已經安裝了cuda和cudnn,在全局的py里添加了torch,能夠調用gpu,當還是只能看到默認的gpu0,顯示不了gpu1
    發(fā)表于 07-25 08:18

    擺脫依賴英偉!OpenAI首次轉向使用谷歌芯片

    地使用非英偉芯片,更顯示出其正在逐步擺脫對英偉芯片的深度依賴,在力布局上邁出了重要戰(zhàn)略調整的一步。 ? OpenAI 依賴
    的頭像 發(fā)表于 07-02 00:59 ?8008次閱讀

    英偉擬再推中國特供GPU,今年6月量產!

    電子發(fā)燒友網綜合報道 近年來,美國政府對華半導體出口管制政策不斷收緊,英偉等半導體企業(yè)面臨嚴峻挑戰(zhàn)。為保持在中國市場的競爭力,英偉推出了多款特供版
    發(fā)表于 05-27 00:03 ?4605次閱讀

    GPU 維修干貨 | 英偉 GPU H100 常見故障有哪些?

    上漲,英偉H100GPU憑借其強大的力,成為AI訓練、高性能計算領域的核心硬件。然而,隨著使用場景的復雜化,H100服務器故障率也逐漸攀
    的頭像 發(fā)表于 05-05 09:03 ?2465次閱讀
    <b class='flag-5'>GPU</b> 維修干貨 | <b class='flag-5'>英偉</b><b class='flag-5'>達</b> <b class='flag-5'>GPU</b> H100 常見故障有哪些?

    IBM攜手英偉AI數據平臺推動企業(yè)級AI創(chuàng)新

    近日,IBM(紐約證券交易所:IBM)宣布與英偉(納斯達克股票代碼:NVDA)開展全新合作,雙方將基于英偉 AI 數據平臺參考架構(re
    發(fā)表于 03-24 19:20 ?415次閱讀

    英偉市值一夜蒸發(fā)近2萬億 英偉股價下跌8%

    在美東時間周一,美股三大指數集體收跌,截至收盤,英偉股價下跌8%,英偉市值一夜蒸發(fā)2650億美元(換算下來約合人民幣19345億元);
    的頭像 發(fā)表于 03-04 10:19 ?991次閱讀

    美銀分析師:英偉加大“物理AI”投入為明智之舉

    新興分支,正逐漸受到業(yè)界的廣泛關注。英偉作為全球領先的圖形處理器(GPU)制造商,其在人工智能領域的實力不容小覷。此次加大對“物理AI”的投入,不僅體現了
    的頭像 發(fā)表于 01-08 10:51 ?742次閱讀

    英偉收購AI初創(chuàng)公司Run:ai

    :ai作為一家專注于AI云計算軟件平臺開發(fā)的初創(chuàng)公司,其產品以高效利用高性能GPU資源為核心,致力于為用戶提供更快速、更便捷的機器學習加速方案。通過此次收購,
    的頭像 發(fā)表于 12-31 10:46 ?866次閱讀

    英偉AI加速器新藍圖:集成硅光子I/O,3D垂直堆疊 DRAM 內存

    加速器設計的愿景。 英偉認為未來整個 AI 加速器復合體將位于大面積先進封裝基板之上,采用垂直供電,集成硅光子 I/O 器件,GPU 采用多模塊設計,3D 垂直堆疊 DRAM 內存
    的頭像 發(fā)表于 12-13 11:37 ?1031次閱讀
    <b class='flag-5'>英偉</b><b class='flag-5'>達</b><b class='flag-5'>AI</b>加速器新藍圖:集成硅光子I/O,3D垂直堆疊 DRAM 內存