chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

英偉達「黃氏定律」讓未來的AI算力每年能夠提升一倍

454398 ? 來源:機器之心 ? 作者:李澤南 ? 2020-12-20 07:30 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

今年的 GTC China 黃仁勛沒有露面,但黃式定律無處不在。

從翻倍提高 TensorCore 計算效能的新技術(shù),到下一代光通信技術(shù),再到一行代碼為所有模型提供 GPU 加速的軟件工具,為了讓未來的 AI 算力每年能夠提升一倍,英偉達找到了不少新方向。

12 月 15 日上午,英偉達 GTC 大會中國站在線上舉行,全球最負盛名的計算機科學(xué)家之一、NVIDIA 研究院負責(zé)人 Bill Dally 在活動中發(fā)表了主題演講。

科技領(lǐng)域里,很多人都知道摩爾定律:前英特爾 CEO 大衛(wèi)·豪斯(David House)曾提出,人類制造出的芯片,每 18 個月計算效率就會提高一倍。這一「規(guī)律」在過去長達五十年間一直被實踐驗證,但在最近五六年中,由于晶體管尺寸越來越小,制程陷入瓶頸,摩爾定律逐漸失效。

而另一方面,人類對于計算機的算力需求是無限的,人工智能技術(shù)的發(fā)展更是加大了這種需求。近十年來,GPU正在讓人工智能算法的性能每年都在成倍提升,英偉達的研究人員通過架構(gòu)的提升,正在不斷尋找進一步加快AI推理速度的芯片。

英偉達提出了以自己創(chuàng)始人黃仁勛名字命名的黃氏定律(Huang’s Law)對單芯片AI推理能力進行了預(yù)測,提出每 12 月其數(shù)字將翻一倍。

如果我們還需要在未來的一段時間里使用硅芯片,那么摩爾定律之后,我們還可以仰賴「黃氏定律」保持AI技術(shù)的發(fā)展速度。

在芯片本身無法快速提升的情況下,英偉達把目光轉(zhuǎn)向了計算架構(gòu)的很多其他方面,Bill Dally 認為「這些方向其中的任何一個如果有效,都可以在接下來幾代的產(chǎn)品中幫助我們延續(xù)性能每年提升一倍的目標?!?/p>

首先是單卡計算效率。即使是英偉達目前的二代 Tensor Core,在進行推理時也無法把所有功耗用在數(shù)學(xué)運算上——效率被浪費在了數(shù)據(jù)傳輸上。英偉達設(shè)計了 MAGNet 系統(tǒng),用于探索更為高效的芯片架構(gòu)設(shè)計。

如果可以通過一個全局控制器,把數(shù)據(jù)從內(nèi)存不同的部分移動到不同計算單元以執(zhí)行計算,并針對神經(jīng)網(wǎng)絡(luò)計算的特性在數(shù)據(jù)流中加入一個存儲層,便可以解除瓶頸,將大部分能量用于計算。在特定的單元上,英偉達尚未發(fā)布的硬件產(chǎn)品可以實現(xiàn)每瓦 100 Teraops 的推理能力,而在 2019 年達到的效率還只有 29 Teraops。

看來下一代的 Tensor Core 性能又要有巨大的提升了。

其次是多卡的數(shù)據(jù)傳輸,英偉達的 GPU 通過 NVlink 和 NVswitch 互相連接,然而基于電信號的方式目前已經(jīng)接近極限了,人們預(yù)估,想要繼續(xù)讓 NVLink 中信號傳輸?shù)膸捗看嵘槐?,將變得極其困難。目前英偉達能夠?qū)崿F(xiàn)的數(shù)字是每線對 50Gb/s,可預(yù)見的未來大約可以實現(xiàn)到 100-200Gb/s。英偉達也在和英特爾等科技巨頭一樣思考如何盡快把基于光學(xué)通信技術(shù)應(yīng)用于實踐。

作為一名研究者,Bill Dally 曾牽頭研發(fā)英偉達對于光信號傳輸?shù)脑妇埃汗馔ㄐ挪粌H可以大幅度提升帶寬(從幾百 Gb/s 到幾 Tb/s),提升傳輸空間(從幾十厘米到 20-100 米)并減少系統(tǒng)的復(fù)雜程度。

在英偉達的設(shè)計中,DGX 卡縱置排列,右側(cè)為光源,可為光線提供多種不同波長的光線,光學(xué)引擎以極高的數(shù)據(jù)速率把光轉(zhuǎn)換為信號。每根光纖都可以同時傳輸不同波長的光,而每種波長的光都可以用 25-50Gb/s 的速度傳輸信號。這樣一來,總數(shù)據(jù)速率將為 400Gb/s,而每根光纖的傳輸速率「保守估計」就可以達到數(shù)個 Tb/s,而且能耗還要比電信號要小。英偉達的研究團隊正在與哥倫比亞大學(xué)的研究人員密切合作,探討如何利用電信供應(yīng)商在其核心網(wǎng)絡(luò)中所采用的技術(shù),通過一條光纖來傳輸數(shù)十路信號——有了光通信,僅需一條 NVLink 就可以連接規(guī)模更大的系統(tǒng)。

英偉達還在嘗試一種名為「密集波分復(fù)用」的技術(shù), 有望在僅一毫米大小的芯片上實現(xiàn) Tb/s 級數(shù)據(jù)的傳輸,是如今互連密度的十倍以上。

除了更大的吞吐量,光鏈路也有助于打造更為密集型的系統(tǒng)。Dally 舉例展示了一個未來將搭載 160 多個 GPU 的 NVIDIA DGX 系統(tǒng)模型。

除了硬件方面的革新,還有軟件。今天有很多應(yīng)用都在被 GPU 加速,遠超英偉達開發(fā)者們更新 CUDA 程序的速度,人們急需一種簡化的編程方式。NVIDIA 的研究人員開發(fā)了全新編程系統(tǒng)原型 Legate。開發(fā)者借助 Legate,即可在任何規(guī)模的系統(tǒng)上,運行針對單一 GPU 編寫的程序——甚至適用于諸如 Selene 等搭載數(shù)千個 GPU 的巨型超級計算機。

對于大多數(shù)人來說,使用 Legate 我們就可以無需更改代碼即讓 Python 程序無感運行在從 Jetson Nano 到 DGX SuperPOD 等所有包含英偉達 cuda 核心的設(shè)備上。開發(fā)者所做的是基于原始的 Python 代碼,將原本的「import NumPy as NP」更改為「import legate.numpy as NP」就可以了。隨后 Legate 庫會開始運行,自動完成之后的操作。

它的運行速率有多快呢?從上表中可以看到,Legate 的處理速度不僅快于目前效率最高的庫,同時在并行化時也能盡量保持住自己的優(yōu)勢。

英偉達也分享了目前國內(nèi)合作伙伴使用新一代芯片的情況:阿里云、百度智能云、滴滴云、騰訊云的大型數(shù)據(jù)中心正在遷移至基于英偉達 Ampere 架構(gòu)的平臺。圖像識別、語音識別,以及包括計算流體動力學(xué)、計算金融學(xué)、分子動力學(xué)在內(nèi)的 GPU 加速高性能計算場景的快速增長,催生了更多對云實例的需求。

在硬件方面,新華三、浪潮、聯(lián)想、寧暢等中國領(lǐng)先系統(tǒng)制造商也在將 A100 GPU 引入到自身產(chǎn)品中,并推出了多款針對不同應(yīng)用場景的系列產(chǎn)品,為超大型數(shù)據(jù)中心提供基于 Ampere 架構(gòu)的加速系統(tǒng),進而為用戶提供兼具超強性能與靈活性的 AI 計算平臺。
編輯:hfy
聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • gpu
    gpu
    +關(guān)注

    關(guān)注

    28

    文章

    5035

    瀏覽量

    133711
  • 計算機
    +關(guān)注

    關(guān)注

    19

    文章

    7721

    瀏覽量

    92267
  • AI
    AI
    +關(guān)注

    關(guān)注

    88

    文章

    36999

    瀏覽量

    289927
  • 英偉達
    +關(guān)注

    關(guān)注

    23

    文章

    4013

    瀏覽量

    96749
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    【AD新聞】AI時代,美元能夠買到多強的?

    當真正需要在嵌入式終端設(shè)備中使用AI技術(shù)時,客戶的訴求更多的集中在功耗、響應(yīng)時間、成本等方面,對性能的無盡追求反而不是重點,這和很多人之前的預(yù)想并不致?;?b class='flag-5'>一美元或瓦電能買到多強的
    發(fā)表于 03-23 15:27

    英偉GPU慘遭專業(yè)礦機碾壓,仁勛宣布砍掉加密貨幣業(yè)務(wù)!

    加密貨幣專用產(chǎn)品上的預(yù)期營收降至1億美元,實際營收只有1800萬美元。預(yù)計未來業(yè)務(wù)對公司的貢獻可以忽略不計。”英偉CEO仁勛也做出類
    發(fā)表于 08-24 10:11

    英偉DPU的過“芯”之處

    ,AI硬件正成為越來越多數(shù)據(jù)中心擴容建設(shè)的關(guān)鍵所在。當超強AI成為數(shù)據(jù)中心的剛需,英偉GP
    發(fā)表于 03-29 14:42

    英偉嵌入式電腦可為機器人設(shè)計引入AI

    英偉在硅谷召開了GTC 2019主題演講,英偉 CEO仁勛發(fā)表演講,正式發(fā)布了機器人開發(fā)者工具箱Jetson Nano,可以為機器人設(shè)
    發(fā)表于 08-12 17:09 ?1201次閱讀

    英偉正式發(fā)布NVIDIA A100,擁有比原來強大20AI

    GPU,為此前在網(wǎng)上盛傳的,被稱為安培(Ampere)的產(chǎn)品。公司創(chuàng)始人兼 CEO 仁勛介紹稱,其包含 540 億晶體管,擁有比原來強大 20 AI
    發(fā)表于 05-15 11:34 ?7054次閱讀

    英偉:GPUAI的性能每年都成倍提升

    英偉首席科學(xué)家Bill Dally在一年一度的中國GPU技術(shù)大會召開前接受第財經(jīng)記者獨家專訪時表示,GPU人工智能(
    的頭像 發(fā)表于 12-15 13:37 ?3009次閱讀

    英偉達官方認可“定律”,摩爾定律會失效嗎?

    :摩爾定律失效后,該如何進步提高處理器的能效?針對這個問題,些公司已經(jīng)找到了自己的答案,比如英偉。 過去幾年來,
    的頭像 發(fā)表于 12-18 16:27 ?3645次閱讀

    英偉霸主之路 “卷王”英偉的真面目

    了臺積電4納米制程工藝,集成1800億個晶體管,浮點計算能力相比前代A100快了三,被看作英偉的新代“核彈”。
    的頭像 發(fā)表于 04-05 14:11 ?3064次閱讀

    角逐AI,比英偉最多快10,光芯片能成為國產(chǎn)之光嗎?

    中信建投指出,近年來光計算在AI領(lǐng)域呈現(xiàn)高速的發(fā)展,具有廣闊的應(yīng)用前景。以Lightmatter和Lightelligence為代表的公司,推出了新型的硅光計算芯片,性能遠超目前的AI
    的頭像 發(fā)表于 07-17 14:47 ?2058次閱讀
    角逐<b class='flag-5'>AI</b><b class='flag-5'>算</b><b class='flag-5'>力</b>,比<b class='flag-5'>英偉</b><b class='flag-5'>達</b>最多快10<b class='flag-5'>倍</b>,光芯片能成為國產(chǎn)之光嗎?

    英偉A100的是多少?

    ,但 A100 的是前者的 20 。 A100是英偉推出的款強大的數(shù)據(jù)中心GPU,采用
    的頭像 發(fā)表于 08-08 15:28 ?4.3w次閱讀

    英偉H200怎么樣

    英偉H200的非常強大。作為新AI芯片,H200在性能上有了顯著的
    的頭像 發(fā)表于 03-07 16:15 ?3695次閱讀

    英偉最新AI芯片Blackwell GPU,AI力能力較上代提升30

    仁勛說:"我們已經(jīng)來到了個臨界點,因此需要種新的計算方式來加速整個行業(yè)的發(fā)展效率。那么英偉能夠
    的頭像 發(fā)表于 03-19 13:39 ?3655次閱讀

    英偉宣布每年設(shè)計代全新AI芯片,加快其他產(chǎn)品線更新速度

    英偉CEO仁勛宣布,公司將每年推出全新AI芯片,以滿足市場需求。他表示,Blackwell后將有新款芯片問世,且
    的頭像 發(fā)表于 05-23 10:41 ?1401次閱讀

    英偉Blackwell芯片已投產(chǎn),預(yù)告未來AI芯片發(fā)展

    英偉創(chuàng)始人兼CEO仁勛近日宣布,公司旗下的Blackwell芯片已正式投入生產(chǎn)。這款芯片是英偉A
    的頭像 發(fā)表于 06-04 09:23 ?2390次閱讀

    第四次工業(yè)革命AI將實現(xiàn)十億倍增長 | 中國AI芯片與英偉的角色

    內(nèi)容提要:仁勛BG2專訪:英偉、OpenAI、未來與美國夢
    的頭像 發(fā)表于 09-29 07:20 ?580次閱讀
    第四次工業(yè)革命<b class='flag-5'>AI</b>將實現(xiàn)十億倍增長 | 中國<b class='flag-5'>AI</b>芯片與<b class='flag-5'>英偉</b><b class='flag-5'>達</b>的角色