伊人精品色婷,少妇人妻一区二区三区

超級(jí)芯片架構(gòu)上的庫(kù)可將計(jì)算工程工具的運(yùn)算速度提升至原來(lái)的 11 倍，并可處理計(jì)算規(guī)模達(dá) 5 倍的任務(wù)。

借助由 NVIDIA 超級(jí)芯片提供支持的NVIDIA CUDA-X庫(kù)，各類科學(xué)家和工程師能夠更快地解決棘手問(wèn)題。

NVIDIA GTC 全球 AI 大會(huì)上宣布，開(kāi)發(fā)者現(xiàn)在可以通過(guò) CUDA-X 與新一代超級(jí)芯片架構(gòu)的協(xié)同，實(shí)現(xiàn) CPU 和 GPU 資源間深度自動(dòng)化整合與調(diào)度，相較于傳統(tǒng)加速計(jì)算架構(gòu)，該技術(shù)可使計(jì)算工程工具運(yùn)行速度提升至原來(lái)的 11 倍，計(jì)算規(guī)模增加至 5 倍。

這極大地加速并改進(jìn)了工程模擬、設(shè)計(jì)優(yōu)化等方面的工作流程，幫助科學(xué)家和研究人員更快地取得突破性成果。

NVIDIA 于 2006 年推出了 CUDA，開(kāi)啟了加速計(jì)算的應(yīng)用新紀(jì)元。歷經(jīng)多年發(fā)展，NVIDIA 已經(jīng)構(gòu)建了 900 多個(gè)專業(yè)領(lǐng)域的 NVIDIA CUDA-X 庫(kù)和 AI 模型，推動(dòng)加速計(jì)算的應(yīng)用，并催生多項(xiàng)重大的科學(xué)突破。如今，CUDA-X 將加速計(jì)算拓展至一系列新的工程領(lǐng)域，包括天文學(xué)、粒子物理學(xué)、量子物理學(xué)、汽車、航空航天及半導(dǎo)體設(shè)計(jì)。

NVIDIA Grace CPU 架構(gòu)可顯著提升顯存帶寬，同時(shí)降低功耗。NVIDIANVLink-C2C互連技術(shù)可提供超高帶寬，使 GPU 和 CPU 能夠共享存儲(chǔ)單元，從而讓開(kāi)發(fā)者簡(jiǎn)化專用代碼編寫(xiě)、處理更大規(guī)模的計(jì)算任務(wù)，并提高應(yīng)用性能。

借助 NVIDIA cuDSS 加速工程求解器

NVIDIA 的超級(jí)芯片架構(gòu)使用戶能夠更高效地利用 CPU 和 GPU 處理能力，從而可以從相同的底層 GPU 中獲得更高的性能。

NVIDIA cuDSS庫(kù)專為解決涉及稀疏矩陣的大型工程模擬問(wèn)題而設(shè)計(jì)，可廣泛用于設(shè)計(jì)優(yōu)化、電磁模擬工作流程等應(yīng)用。cuDSS 通過(guò) Grace GPU 顯存與高帶寬 NVLink-C2C 互連技術(shù)，實(shí)現(xiàn)對(duì)超出設(shè)備顯存容量限制的大型矩陣的分解和求解，從而使用戶能夠在極短時(shí)間內(nèi)解決極其龐大的問(wèn)題。

GPU 和 Grace GPU 之間的一致共享存儲(chǔ)單元可最大限度地減少數(shù)據(jù)遷移，從而顯著降低大型系統(tǒng)的運(yùn)行開(kāi)銷。對(duì)于各類大規(guī)模計(jì)算工程問(wèn)題，通過(guò) Grace CPU 存儲(chǔ)單元和超級(jí)芯片架構(gòu)，在相同 GPU 和 cuDSS 混合顯存技術(shù)下，可將最耗時(shí)的求解環(huán)節(jié)速度提升至原來(lái)的 4 倍。

Ansys 已將 cuDSS 集成到其 HFSS 求解器中，顯著增強(qiáng)了電磁模擬的性能。借助 cuDSS，HFSS 軟件可將矩陣求解器速度提升至原來(lái)的 11 倍。

Altair OptiStruct 采用了 cuDSS Direct Sparse Solver 庫(kù)，極大加速了其有限元分析的工作負(fù)載。

這些性能的提升是通過(guò)優(yōu)化 GPU 上的關(guān)鍵操作，同時(shí)智能地使用 CPU 進(jìn)行共享存儲(chǔ)單元以及異構(gòu) CPU 和 GPU 執(zhí)行來(lái)實(shí)現(xiàn)的。cuDSS 可自動(dòng)檢測(cè)利用 CPU 能提供額外優(yōu)勢(shì)的區(qū)域，從而進(jìn)一步提高效率。

借助超級(jí)芯片顯存以超快速度進(jìn)行擴(kuò)展

NVLink-CNC 互聯(lián)技術(shù)可提供 CPU 和 GPU 之間的顯存一致性，從而在單個(gè) GPU 上擴(kuò)展顯存受限的應(yīng)用程序。

許多工程模擬都受到規(guī)模的限制，需要進(jìn)行大量模擬才能生成設(shè)計(jì)包含復(fù)雜組件（如飛機(jī)引擎）的設(shè)備所需的分辨率。通過(guò)利用在 CPU 和 GPU 顯存之間無(wú)縫讀寫(xiě)的能力，工程師可以輕松實(shí)現(xiàn)核外求解器來(lái)處理更大的數(shù)據(jù)。

NVIDIA cuQuantum 助力量子計(jì)算研究

量子計(jì)算機(jī)有望加速解決許多科學(xué)和工業(yè)學(xué)科的核心問(wèn)題。縮短有用量子計(jì)算的時(shí)間，很大程度上取決于模擬極其復(fù)雜的量子系統(tǒng)的能力。

模擬使研究人員能夠在當(dāng)下開(kāi)發(fā)新算法，以適應(yīng)未來(lái)的量子計(jì)算機(jī)規(guī)模。此外，它們還在優(yōu)化量子處理器、運(yùn)行復(fù)雜的性能仿真，以及新量子比特設(shè)計(jì)的噪聲特性方面發(fā)揮著關(guān)鍵作用。

量子算法的所謂狀態(tài)向量模擬需要對(duì)存儲(chǔ)在顯存中的指數(shù)級(jí)大規(guī)模向量執(zhí)行矩陣運(yùn)算。而張量網(wǎng)絡(luò)模擬則通過(guò)張量收縮來(lái)模擬量子算法，對(duì)于特定重要類別的應(yīng)用，能夠?qū)崿F(xiàn)成百上千個(gè)量子比特的模擬規(guī)模。

NVIDIA cuQuantum庫(kù)可加速這些工作負(fù)載。cuQuantum 與每個(gè)領(lǐng)先的量子計(jì)算框架集成，因此所有量子研究人員都可以在不更改代碼的情況下利用模擬性能。

聲明：本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人，不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用，如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題，請(qǐng)聯(lián)系本站處理。舉報(bào)投訴