chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

近600個應(yīng)用程序通過NVIDIA GPU實現(xiàn)了提速

NVIDIA英偉達(dá)企業(yè)解決方案 ? 來源:cc ? 2019-02-14 14:15 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

十幾年前,還不曾有加速應(yīng)用程序。而如今已有近600個應(yīng)用程序通過NVIDIA GPU實現(xiàn)了提速。

這些應(yīng)用程序涵蓋了物理、生物科學(xué)、分子動力學(xué)、化學(xué)和天氣預(yù)報等各個領(lǐng)域。其中包括全球最熱門的15個高性能計算應(yīng)用程序,也都是通過GPU實現(xiàn)加速的。去年,NVIDIA GPU應(yīng)用程序目錄收錄了100多個應(yīng)用程序,接下來還會有更多的程序?qū)⒈魂懤m(xù)添加到目錄中。

Intersect 360研究所的一份報告中收錄了數(shù)據(jù)中心運(yùn)行的各個關(guān)鍵應(yīng)用程序。其中,排名前15的應(yīng)用程序均由GPU加速,這些都是一系列殺手級的核心科學(xué)應(yīng)用程序。其中包括:

GROMACS(化學(xué))– 分子動力學(xué)應(yīng)用程序,旨在模擬包含了數(shù)百到數(shù)百萬個粒子的系統(tǒng)的牛頓運(yùn)動方程。

ANSYS(流體動力學(xué)分析)– 模擬液體和氣體與表面的相互作用。

Gaussian(化學(xué))– 預(yù)測分子系統(tǒng)的能量、分子結(jié)構(gòu)和振動頻率。

VASP(化學(xué))– 用于從頭計算法量子力學(xué)分子動力學(xué)模擬。

NAMD(化學(xué))– 大型生物分子系統(tǒng)的高性能模擬。

Simulia Abaqus(結(jié)構(gòu)分析)– 用于結(jié)構(gòu)力學(xué)的模擬和分析。

WRF(天氣/環(huán)境建模)– 數(shù)值天氣預(yù)報系統(tǒng),專為大氣研究和操作預(yù)測應(yīng)用程序而設(shè)計。

OpenFOAM(流體動力學(xué)分析)– 通用型 CFD 軟件的求解器庫。

ANSYS(結(jié)構(gòu)分析)– 對高頻和高速電子元件中的 3D 全波電磁場進(jìn)行建模。

LS-DYNA(結(jié)構(gòu)分析)– 結(jié)構(gòu)力學(xué)的模擬和分析工具。

BLAST(生物科學(xué))– 應(yīng)用最為廣泛的生物信息學(xué)工具之一。

LAMMPS(化學(xué))– 經(jīng)典分子動力學(xué)程序包。

Amber(化學(xué))– 專門針對生物分子系統(tǒng)模擬而開發(fā)的分子動力學(xué)應(yīng)用程序。

Quantum Espresso(化學(xué))– 一套集成的計算機(jī)代碼,用于電子結(jié)構(gòu)計算和納米級材料建模。

GAMESS(化學(xué))– 用于模擬原子和分子電子結(jié)構(gòu)的計算化學(xué)套件。

這些工具本身無法實現(xiàn)性能的遞增性提升。但通過采用NVIDIA GPU的服務(wù)器,其性能通??商岣?0 倍或更多。并且,GPU加速可以改善數(shù)據(jù)中心的經(jīng)濟(jì)效益。

預(yù)測天氣

天氣預(yù)報是一項遠(yuǎn)比其看起來更加困難的工作。天氣預(yù)報是高性能計算領(lǐng)域的一個重要分支。準(zhǔn)確可靠的天氣預(yù)報不僅可以拯救生命,還有助于航空、能源和公用事業(yè)、保險、零售和其他行業(yè)做出經(jīng)濟(jì)決策。

天氣預(yù)報需要大量的計算資源,包括幾何尺度(尤其是全球天氣預(yù)報),和大量描述大氣狀態(tài)的變量。

但是,受限于可用的計算量和應(yīng)用程序的性能,當(dāng)前的天氣預(yù)報模型僅限于低分辨率的模擬,例如12公里的分辨率。

這些模型忽略了一些重要的細(xì)節(jié),例如云層的影響(云層可以反射太陽輻射,在天氣模式中扮演著重要的角色)。采用1公里云分辨率可以改善預(yù)測效果,但這需要 應(yīng)用程序的性能提升1700倍。

GPU加速可以彌補(bǔ)此差距,提高天氣預(yù)報的準(zhǔn)確性。

加速空氣動力學(xué)模擬

使用NASA的FUN3D代碼模擬SLS Block 1B助推器分離流場。該圖片由Jamie Meeroff,Henry Lee,NASA/Ames提供。

火箭能夠以超高的速度飛行,然而利用大規(guī)模空氣動力學(xué)模擬,我們可以對其進(jìn)行改進(jìn),讓火箭可以飛得更快、更高效。

NASA蘭利研究中心開發(fā)的FUN3D計算流體動力學(xué)軟件,可用于模擬各種空氣動力學(xué)應(yīng)用程序中的流體流動。該應(yīng)用程序在NASA Pleiades超級計算機(jī)上消耗的周期比其他任何應(yīng)用程序都要多。借助于GPU加速,采用了6個NVIDIA V100 Tensor Core GPU的服務(wù)器能夠以高出雙插槽CPU服務(wù)器30倍的性能運(yùn)行這些模擬。

總結(jié):GPU具備非常好的性能,從而高效地計算規(guī)模更大、更復(fù)雜的模擬。NASA已經(jīng)證明,在Summit超級計算機(jī)上,僅需運(yùn)行1000臺GPU服務(wù)器就可以完成100多萬個CPU核心的工作。而且,其能源成本遠(yuǎn)低于CPU。

性能持續(xù)提升

我們在各個加速計算領(lǐng)域都擁有深厚的儲備。結(jié)合由100多萬名開發(fā)人員組成的生態(tài)系統(tǒng),我們將共同形成一個不斷改進(jìn)的平臺。該平臺可以在相同的 GPU加速服務(wù)器上提供更高的應(yīng)用程序性能。

例如,在包含 11 個高性能計算應(yīng)用程序的組合中,對于采用4個NVIDIA Tesla P100 GPU的服務(wù)器,其當(dāng)前的運(yùn)行速度比兩年前提高了2倍。如果同時改進(jìn)軟件堆棧和GPU架構(gòu),您可以獲得更大的性能提升。

現(xiàn)在,通過單一平臺,您可以加速各種高性能計算領(lǐng)域的應(yīng)用程序:科學(xué)計算、工業(yè)模擬、深度學(xué)習(xí)機(jī)器學(xué)習(xí)。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • NVIDIA
    +關(guān)注

    關(guān)注

    14

    文章

    5696

    瀏覽量

    110120
  • gpu
    gpu
    +關(guān)注

    關(guān)注

    28

    文章

    5278

    瀏覽量

    136076

原文標(biāo)題:GPU已加速的近600個高性能計算應(yīng)用程序都有哪些?

文章出處:【微信號:NVIDIA-Enterprise,微信公眾號:NVIDIA英偉達(dá)企業(yè)解決方案】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    NVIDIA與Google Cloud攜手推進(jìn)代理式與物理AI發(fā)展

    企業(yè)可以使用 NVIDIA Vera Rubin 驅(qū)動的 A5X 實例 (可擴(kuò)展至 100 萬 Rubin GPU)、Google Distributed Cloud 上的 Gem
    的頭像 發(fā)表于 04-27 15:35 ?244次閱讀

    如何在 i.MX RT1050 上實現(xiàn)鏡像(引導(dǎo)加載程序應(yīng)用程序)的雙 HAB 身份驗證?

    )。 目前,我的想法是實現(xiàn)自定義身份驗證機(jī)制在第二階段引導(dǎo)加載程序中。引導(dǎo)加載程序將: 讀取應(yīng)用程序映像頁腳(包含公鑰、SHA-256
    發(fā)表于 04-07 06:14

    NVIDIA NVQLink推動量子計算迎來轉(zhuǎn)折點

    在 GTC 上,NVIDIA 通過名為 cudaq-realtime 的全新應(yīng)用程序接口(API)正式公開 NVQLink,并展示多項推動量子糾錯領(lǐng)域最新進(jìn)展的演示成果。
    的頭像 發(fā)表于 04-01 09:19 ?787次閱讀

    NVIDIA向Kubernetes社區(qū)捐贈動態(tài)資源分配GPU驅(qū)動程序

    此外,NVIDIA 在 KubeCon Europe 大會上宣布推出適用于 GPU 加速工作負(fù)載的機(jī)密容器解決方案、NVIDIA KAI Scheduler 更新,以及用于實現(xiàn)大規(guī)模
    的頭像 發(fā)表于 04-01 09:10 ?728次閱讀

    借助NVIDIA CUDA Tile IR后端推進(jìn)OpenAI Triton的GPU編程

    NVIDIA CUDA Tile 是基于 GPU 的編程模型,其設(shè)計目標(biāo)是為 NVIDIA Tensor Cores 提供可移植性,從而釋放 GPU 的極限性能。CUDA Tile 的
    的頭像 發(fā)表于 02-10 10:31 ?531次閱讀

    NVIDIA RTX PRO 5000 Blackwell GPU的深度評測

    NVIDIA RTX PRO 5000 Blackwell 是 NVIDIA RTX 5000 Ada Generation 的升級迭代產(chǎn)品,其各項核心指標(biāo)均針對 GPU 加速工作流的高性能
    的頭像 發(fā)表于 01-06 09:51 ?4111次閱讀
    <b class='flag-5'>NVIDIA</b> RTX PRO 5000 Blackwell <b class='flag-5'>GPU</b>的深度評測

    NVIDIA RTX PRO 4000 Blackwell GPU性能測試

    Generation 的全面超越。那么,這款劃時代的專業(yè) GPU 在真實應(yīng)用場景中的表現(xiàn)究竟如何?今天,我們將通過深度實測,為您揭曉 NVIDIA RTX PRO 4000 Blackwell 相較于前代產(chǎn)品的性能躍遷。
    的頭像 發(fā)表于 12-29 15:30 ?1859次閱讀
    <b class='flag-5'>NVIDIA</b> RTX PRO 4000 Blackwell <b class='flag-5'>GPU</b>性能測試

    在Python中借助NVIDIA CUDA Tile簡化GPU編程

    NVIDIA CUDA 13.1 版本新增基于 Tile 的GPU 編程模式。它是自 CUDA 發(fā)明以來 GPU 編程最核心的更新之一。借助 GP
    的頭像 發(fā)表于 12-13 10:12 ?1430次閱讀
    在Python中借助<b class='flag-5'>NVIDIA</b> CUDA Tile簡化<b class='flag-5'>GPU</b>編程

    NVIDIA RTX PRO 2000 Blackwell GPU性能測試

    越來越多的應(yīng)用正在使用 AI 加速,而無論工作站的大小或形態(tài)如何,都有越來越多的用戶需要 AI 性能。NVIDIA RTX PRO 2000 Blackwell 是全新 NVIDIA
    的頭像 發(fā)表于 11-28 09:39 ?7048次閱讀
    <b class='flag-5'>NVIDIA</b> RTX PRO 2000 Blackwell <b class='flag-5'>GPU</b>性能測試

    NVIDIA Isaac Lab多GPU多節(jié)點訓(xùn)練指南

    NVIDIA Isaac Lab 是一適用于機(jī)器人學(xué)習(xí)的開源統(tǒng)一框架,基于 NVIDIA Isaac Sim 開發(fā),其模塊化高保真仿真適用于各種訓(xùn)練環(huán)境,可提供各種物理 AI 功能和由 GP
    的頭像 發(fā)表于 09-23 17:15 ?2633次閱讀
    <b class='flag-5'>NVIDIA</b> Isaac Lab多<b class='flag-5'>GPU</b>多節(jié)點訓(xùn)練指南

    DeepSeek R1 MTP在TensorRT-LLM中的實現(xiàn)與優(yōu)化

    TensorRT-LLM 在 NVIDIA Blackwell GPU 上創(chuàng)下了 DeepSeek-R1 推理性能的世界紀(jì)錄,Multi-Token Prediction (MTP) 實現(xiàn)
    的頭像 發(fā)表于 08-30 15:47 ?4690次閱讀
    DeepSeek R1 MTP在TensorRT-LLM中的<b class='flag-5'>實現(xiàn)</b>與優(yōu)化

    NVIDIA RTX PRO 4500 Blackwell GPU測試分析

    今天我們帶來全新 NVIDIA Blackwell 架構(gòu) GPU —— NVIDIA RTX PRO 4500 Blackwell 的測試,對比上一代產(chǎn)品 NVIDIA RTX 450
    的頭像 發(fā)表于 08-28 11:02 ?4378次閱讀
    <b class='flag-5'>NVIDIA</b> RTX PRO 4500 Blackwell <b class='flag-5'>GPU</b>測試分析

    NVIDIA桌面GPU系列擴(kuò)展新產(chǎn)品

    NVIDIA 桌面 GPU 系列擴(kuò)展,推出 NVIDIA RTX PRO 4000 SFF Edition GPU 和 RTX PRO 2000 Blackwell
    的頭像 發(fā)表于 08-18 11:50 ?1649次閱讀

    NVIDIA Blackwell GPU優(yōu)化DeepSeek-R1性能 打破DeepSeek-R1在最小延遲場景中的性能紀(jì)錄

    本文將探討 NVIDIA TensorRT-LLM 如何基于 8 NVIDIA Blackwell GPU 的配置,打破 DeepSeek-R1 在最小延遲場景中的性能紀(jì)錄:在 G
    的頭像 發(fā)表于 07-02 19:31 ?3563次閱讀
    <b class='flag-5'>NVIDIA</b> Blackwell <b class='flag-5'>GPU</b>優(yōu)化DeepSeek-R1性能 打破DeepSeek-R1在最小延遲場景中的性能紀(jì)錄

    【「算力芯片 | 高性能 CPU/GPU/NPU 微架構(gòu)分析」閱讀體驗】+NVlink技術(shù)從應(yīng)用到原理

    兩種結(jié)構(gòu): ①GPU-GPU ②CPU-GPU 這是書中介紹的一包括完全
    發(fā)表于 06-18 19:31