chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

近600個(gè)應(yīng)用程序通過NVIDIA GPU實(shí)現(xiàn)了提速

NVIDIA英偉達(dá)企業(yè)解決方案 ? 來源:cc ? 2019-02-14 14:15 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

十幾年前,還不曾有加速應(yīng)用程序。而如今已有近600個(gè)應(yīng)用程序通過NVIDIA GPU實(shí)現(xiàn)了提速。

這些應(yīng)用程序涵蓋了物理、生物科學(xué)、分子動(dòng)力學(xué)、化學(xué)和天氣預(yù)報(bào)等各個(gè)領(lǐng)域。其中包括全球最熱門的15個(gè)高性能計(jì)算應(yīng)用程序,也都是通過GPU實(shí)現(xiàn)加速的。去年,NVIDIA GPU應(yīng)用程序目錄收錄了100多個(gè)應(yīng)用程序,接下來還會(huì)有更多的程序?qū)⒈魂懤m(xù)添加到目錄中。

Intersect 360研究所的一份報(bào)告中收錄了數(shù)據(jù)中心運(yùn)行的各個(gè)關(guān)鍵應(yīng)用程序。其中,排名前15的應(yīng)用程序均由GPU加速,這些都是一系列殺手級的核心科學(xué)應(yīng)用程序。其中包括:

GROMACS(化學(xué))– 分子動(dòng)力學(xué)應(yīng)用程序,旨在模擬包含了數(shù)百到數(shù)百萬個(gè)粒子的系統(tǒng)的牛頓運(yùn)動(dòng)方程。

ANSYS(流體動(dòng)力學(xué)分析)– 模擬液體和氣體與表面的相互作用。

Gaussian(化學(xué))– 預(yù)測分子系統(tǒng)的能量、分子結(jié)構(gòu)和振動(dòng)頻率。

VASP(化學(xué))– 用于從頭計(jì)算法量子力學(xué)分子動(dòng)力學(xué)模擬。

NAMD(化學(xué))– 大型生物分子系統(tǒng)的高性能模擬。

Simulia Abaqus(結(jié)構(gòu)分析)– 用于結(jié)構(gòu)力學(xué)的模擬和分析。

WRF(天氣/環(huán)境建模)– 數(shù)值天氣預(yù)報(bào)系統(tǒng),專為大氣研究和操作預(yù)測應(yīng)用程序而設(shè)計(jì)。

OpenFOAM(流體動(dòng)力學(xué)分析)– 通用型 CFD 軟件的求解器庫。

ANSYS(結(jié)構(gòu)分析)– 對高頻和高速電子元件中的 3D 全波電磁場進(jìn)行建模。

LS-DYNA(結(jié)構(gòu)分析)– 結(jié)構(gòu)力學(xué)的模擬和分析工具。

BLAST(生物科學(xué))– 應(yīng)用最為廣泛的生物信息學(xué)工具之一。

LAMMPS(化學(xué))– 經(jīng)典分子動(dòng)力學(xué)程序包。

Amber(化學(xué))– 專門針對生物分子系統(tǒng)模擬而開發(fā)的分子動(dòng)力學(xué)應(yīng)用程序。

Quantum Espresso(化學(xué))– 一套集成的計(jì)算機(jī)代碼,用于電子結(jié)構(gòu)計(jì)算和納米級材料建模。

GAMESS(化學(xué))– 用于模擬原子和分子電子結(jié)構(gòu)的計(jì)算化學(xué)套件。

這些工具本身無法實(shí)現(xiàn)性能的遞增性提升。但通過采用NVIDIA GPU的服務(wù)器,其性能通常可提高10 倍或更多。并且,GPU加速可以改善數(shù)據(jù)中心的經(jīng)濟(jì)效益。

預(yù)測天氣

天氣預(yù)報(bào)是一項(xiàng)遠(yuǎn)比其看起來更加困難的工作。天氣預(yù)報(bào)是高性能計(jì)算領(lǐng)域的一個(gè)重要分支。準(zhǔn)確可靠的天氣預(yù)報(bào)不僅可以拯救生命,還有助于航空、能源和公用事業(yè)、保險(xiǎn)、零售和其他行業(yè)做出經(jīng)濟(jì)決策。

天氣預(yù)報(bào)需要大量的計(jì)算資源,包括幾何尺度(尤其是全球天氣預(yù)報(bào)),和大量描述大氣狀態(tài)的變量。

但是,受限于可用的計(jì)算量和應(yīng)用程序的性能,當(dāng)前的天氣預(yù)報(bào)模型僅限于低分辨率的模擬,例如12公里的分辨率。

這些模型忽略了一些重要的細(xì)節(jié),例如云層的影響(云層可以反射太陽輻射,在天氣模式中扮演著重要的角色)。采用1公里云分辨率可以改善預(yù)測效果,但這需要 應(yīng)用程序的性能提升1700倍。

GPU加速可以彌補(bǔ)此差距,提高天氣預(yù)報(bào)的準(zhǔn)確性。

加速空氣動(dòng)力學(xué)模擬

使用NASA的FUN3D代碼模擬SLS Block 1B助推器分離流場。該圖片由Jamie Meeroff,Henry Lee,NASA/Ames提供。

火箭能夠以超高的速度飛行,然而利用大規(guī)模空氣動(dòng)力學(xué)模擬,我們可以對其進(jìn)行改進(jìn),讓火箭可以飛得更快、更高效。

NASA蘭利研究中心開發(fā)的FUN3D計(jì)算流體動(dòng)力學(xué)軟件,可用于模擬各種空氣動(dòng)力學(xué)應(yīng)用程序中的流體流動(dòng)。該應(yīng)用程序在NASA Pleiades超級計(jì)算機(jī)上消耗的周期比其他任何應(yīng)用程序都要多。借助于GPU加速,采用了6個(gè)NVIDIA V100 Tensor Core GPU的服務(wù)器能夠以高出雙插槽CPU服務(wù)器30倍的性能運(yùn)行這些模擬。

總結(jié):GPU具備非常好的性能,從而高效地計(jì)算規(guī)模更大、更復(fù)雜的模擬。NASA已經(jīng)證明,在Summit超級計(jì)算機(jī)上,僅需運(yùn)行1000臺GPU服務(wù)器就可以完成100多萬個(gè)CPU核心的工作。而且,其能源成本遠(yuǎn)低于CPU。

性能持續(xù)提升

我們在各個(gè)加速計(jì)算領(lǐng)域都擁有深厚的儲備。結(jié)合由100多萬名開發(fā)人員組成的生態(tài)系統(tǒng),我們將共同形成一個(gè)不斷改進(jìn)的平臺。該平臺可以在相同的 GPU加速服務(wù)器上提供更高的應(yīng)用程序性能。

例如,在包含 11 個(gè)高性能計(jì)算應(yīng)用程序的組合中,對于采用4個(gè)NVIDIA Tesla P100 GPU的服務(wù)器,其當(dāng)前的運(yùn)行速度比兩年前提高了2倍。如果同時(shí)改進(jìn)軟件堆棧和GPU架構(gòu),您可以獲得更大的性能提升。

現(xiàn)在,通過單一平臺,您可以加速各種高性能計(jì)算領(lǐng)域的應(yīng)用程序:科學(xué)計(jì)算、工業(yè)模擬、深度學(xué)習(xí)機(jī)器學(xué)習(xí)

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報(bào)投訴
  • NVIDIA
    +關(guān)注

    關(guān)注

    14

    文章

    5570

    瀏覽量

    109388
  • gpu
    gpu
    +關(guān)注

    關(guān)注

    28

    文章

    5152

    瀏覽量

    134755

原文標(biāo)題:GPU已加速的近600個(gè)高性能計(jì)算應(yīng)用程序都有哪些?

文章出處:【微信號:NVIDIA-Enterprise,微信公眾號:NVIDIA英偉達(dá)企業(yè)解決方案】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點(diǎn)推薦

    NVIDIA RTX PRO 5000 Blackwell GPU的深度評測

    NVIDIA RTX PRO 5000 Blackwell 是 NVIDIA RTX 5000 Ada Generation 的升級迭代產(chǎn)品,其各項(xiàng)核心指標(biāo)均針對 GPU 加速工作流的高性能
    的頭像 發(fā)表于 01-06 09:51 ?957次閱讀
    <b class='flag-5'>NVIDIA</b> RTX PRO 5000 Blackwell <b class='flag-5'>GPU</b>的深度評測

    NVIDIA RTX PRO 4000 Blackwell GPU性能測試

    Generation 的全面超越。那么,這款劃時(shí)代的專業(yè) GPU 在真實(shí)應(yīng)用場景中的表現(xiàn)究竟如何?今天,我們將通過深度實(shí)測,為您揭曉 NVIDIA RTX PRO 4000 Blackwell 相較于前代產(chǎn)品的性能躍遷。
    的頭像 發(fā)表于 12-29 15:30 ?754次閱讀
    <b class='flag-5'>NVIDIA</b> RTX PRO 4000 Blackwell <b class='flag-5'>GPU</b>性能測試

    在Python中借助NVIDIA CUDA Tile簡化GPU編程

    NVIDIA CUDA 13.1 版本新增基于 Tile 的GPU 編程模式。它是自 CUDA 發(fā)明以來 GPU 編程最核心的更新之一。借助 GP
    的頭像 發(fā)表于 12-13 10:12 ?1001次閱讀
    在Python中借助<b class='flag-5'>NVIDIA</b> CUDA Tile簡化<b class='flag-5'>GPU</b>編程

    NVIDIA RTX PRO 2000 Blackwell GPU性能測試

    越來越多的應(yīng)用正在使用 AI 加速,而無論工作站的大小或形態(tài)如何,都有越來越多的用戶需要 AI 性能。NVIDIA RTX PRO 2000 Blackwell 是全新 NVIDIA
    的頭像 發(fā)表于 11-28 09:39 ?5621次閱讀
    <b class='flag-5'>NVIDIA</b> RTX PRO 2000 Blackwell <b class='flag-5'>GPU</b>性能測試

    NVIDIA Isaac Lab多GPU多節(jié)點(diǎn)訓(xùn)練指南

    NVIDIA Isaac Lab 是一個(gè)適用于機(jī)器人學(xué)習(xí)的開源統(tǒng)一框架,基于 NVIDIA Isaac Sim 開發(fā),其模塊化高保真仿真適用于各種訓(xùn)練環(huán)境,可提供各種物理 AI 功能和由 GP
    的頭像 發(fā)表于 09-23 17:15 ?2241次閱讀
    <b class='flag-5'>NVIDIA</b> Isaac Lab多<b class='flag-5'>GPU</b>多節(jié)點(diǎn)訓(xùn)練指南

    DeepSeek R1 MTP在TensorRT-LLM中的實(shí)現(xiàn)與優(yōu)化

    TensorRT-LLM 在 NVIDIA Blackwell GPU 上創(chuàng)下了 DeepSeek-R1 推理性能的世界紀(jì)錄,Multi-Token Prediction (MTP) 實(shí)現(xiàn)
    的頭像 發(fā)表于 08-30 15:47 ?4317次閱讀
    DeepSeek R1 MTP在TensorRT-LLM中的<b class='flag-5'>實(shí)現(xiàn)</b>與優(yōu)化

    NVIDIA RTX PRO 4500 Blackwell GPU測試分析

    今天我們帶來全新 NVIDIA Blackwell 架構(gòu) GPU —— NVIDIA RTX PRO 4500 Blackwell 的測試,對比上一代產(chǎn)品 NVIDIA RTX 450
    的頭像 發(fā)表于 08-28 11:02 ?3697次閱讀
    <b class='flag-5'>NVIDIA</b> RTX PRO 4500 Blackwell <b class='flag-5'>GPU</b>測試分析

    NVIDIA桌面GPU系列擴(kuò)展新產(chǎn)品

    NVIDIA 桌面 GPU 系列擴(kuò)展,推出 NVIDIA RTX PRO 4000 SFF Edition GPU 和 RTX PRO 2000 Blackwell
    的頭像 發(fā)表于 08-18 11:50 ?1274次閱讀

    NVIDIA Blackwell GPU優(yōu)化DeepSeek-R1性能 打破DeepSeek-R1在最小延遲場景中的性能紀(jì)錄

    本文將探討 NVIDIA TensorRT-LLM 如何基于 8 個(gè) NVIDIA Blackwell GPU 的配置,打破 DeepSeek-R1 在最小延遲場景中的性能紀(jì)錄:在 G
    的頭像 發(fā)表于 07-02 19:31 ?3116次閱讀
    <b class='flag-5'>NVIDIA</b> Blackwell <b class='flag-5'>GPU</b>優(yōu)化DeepSeek-R1性能 打破DeepSeek-R1在最小延遲場景中的性能紀(jì)錄

    【「算力芯片 | 高性能 CPU/GPU/NPU 微架構(gòu)分析」閱讀體驗(yàn)】+NVlink技術(shù)從應(yīng)用到原理

    兩種結(jié)構(gòu): ①GPU-GPU ②CPU-GPU 這是書中介紹的一個(gè)包括個(gè)完全
    發(fā)表于 06-18 19:31

    NVIDIA虛擬GPU 18.0版本的亮點(diǎn)

    NVIDIA 虛擬 GPU(vGPU)技術(shù)可在虛擬桌面基礎(chǔ)設(shè)施(VDI)中解鎖 AI 功能,使其比以往更加強(qiáng)大、用途更加廣泛。vGPU 通過為各種虛擬化環(huán)境中的 AI 驅(qū)動(dòng)工作負(fù)載提供動(dòng)力,提高了
    的頭像 發(fā)表于 04-07 11:28 ?1288次閱讀

    使用NVIDIA RTX PRO Blackwell系列GPU加速AI開發(fā)

    NVIDIA GTC 推出新一代專業(yè)級 GPU 和 AI 賦能的開發(fā)者工具—同時(shí),ChatRTX 更新現(xiàn)已支持 NVIDIA NIM,RTX Remix 正式結(jié)束測試階段,本月的 NVIDIA
    的頭像 發(fā)表于 03-28 09:59 ?1204次閱讀

    可以手動(dòng)構(gòu)建imx-gpu-viv嗎?

    所需的庫版本。但是當(dāng)我嘗試運(yùn)行應(yīng)用程序時(shí),它導(dǎo)致分段錯(cuò)誤。 有沒有辦法在 Debian 10 中自己構(gòu)建 imx-gpu 庫,這樣它們就不需要 glibc 2.28 版本? 如
    發(fā)表于 03-28 06:35

    NVIDIA GPU助力科研人員探索外星世界

    NVIDIA GPU 驅(qū)動(dòng)的深度學(xué)習(xí)在短短幾秒內(nèi)解讀出了卡西尼號土星探測器多年來收集的海量數(shù)據(jù),為科研人員探索外星世界提供更加智能的方式。
    的頭像 發(fā)表于 02-27 10:37 ?933次閱讀

    AWTK-WEB 快速入門(5) - C 語言 WebSocket 應(yīng)用程序

    導(dǎo)讀WebSocket可以實(shí)現(xiàn)雙向通信,適合實(shí)時(shí)通信場景。本文介紹一下使用C語言開發(fā)AWTK-WEB應(yīng)用程序,并用WebSocket與服務(wù)器通訊。用AWTKDesigner新建一個(gè)應(yīng)用程序
    的頭像 發(fā)表于 02-19 11:49 ?1003次閱讀
    AWTK-WEB 快速入門(5) - C 語言 WebSocket <b class='flag-5'>應(yīng)用程序</b>