chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

新版本CUDA 11.6工具包的功能

星星科技指導(dǎo)員 ? 來源:NVIDIA ? 作者:NVIDIA ? 2022-04-02 16:43 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

NVIDIA 發(fā)布的 CUDA 開發(fā)環(huán)境 CUDA 11.6 的最新版本。本版本的重點是增強 CUDA 應(yīng)用程序的編程模型和性能。 CUDA 繼續(xù)推動 GPU 加速度的邊界,并為 HPC 、可視化、 AI 、 ML 和 DL 和數(shù)據(jù)科學(xué)中的新應(yīng)用奠定基礎(chǔ)。

CUDA 11.6 有幾個重要特性。這篇文章概述了關(guān)鍵功能:

GSP 驅(qū)動程序架構(gòu)現(xiàn)在默認(rèn)為圖靈和安培 GPU

新 API 允許禁用實例化圖中的節(jié)點

完全支持 128 位整數(shù)類型

協(xié)作組命名空間更新

CUDA 編譯器更新

Nsight Compute 2022.1 版本

CUDA 11.6 附帶 R510 驅(qū)動程序,這是一個更新分支。 CUDA 11.6 工具包可供下載 。

GSP 驅(qū)動程序體系結(jié)構(gòu)

GSP 驅(qū)動程序體系結(jié)構(gòu)現(xiàn)在是所有列出的圖靈和安培 GPU 的默認(rèn)驅(qū)動程序模式。較舊的驅(qū)動程序體系結(jié)構(gòu)作為后備支持。有關(guān)更多信息,請參閱 R510 驅(qū)動程序自述 。

實例化的圖形節(jié)點 API 添加

我們添加了一個新的 API cudaGraphNodeSetEnabled,以允許禁用實例化圖中的節(jié)點。在此版本中,支持僅限于內(nèi)核節(jié)點。相應(yīng)的 API cudaGraphNodeGetEnabled允許查詢節(jié)點的啟用狀態(tài)。我們還添加了禁用空內(nèi)核圖節(jié)點啟動的功能。

128 位整數(shù)支持

CUDA 11.6 包括 128 位整數(shù)(__int128)數(shù)據(jù)類型的完整版本,包括編譯器和開發(fā)工具支持。主機端編譯器必須支持__int128類型才能使用此功能。

協(xié)作組名稱空間

協(xié)作組名稱空間已更新為新函數(shù),以提高命名、函數(shù)范圍以及單元維度和大小的一致性。

CUDA 編譯器

在編譯過程中向目標(biāo)安裝的 GPU 添加了-arch=native編譯選項。這擴展了現(xiàn)有的-gencode=arch=compute_xx,code=sm_xx體系結(jié)構(gòu)規(guī)范

添加從nvlink創(chuàng)建 PTX 文件的功能

不推薦的功能

不推薦使用用于設(shè)備上 fork 和 join 并行的cudaDeviceSynchronize(),以便為具有更高性能的替換編程模型做準(zhǔn)備。這些函數(shù)在本版本中繼續(xù)工作,但這些工具會發(fā)出有關(guān)即將發(fā)生的更改的警告。

CentOS Linux 8 已經(jīng)到了生命的盡頭 在 2021 年 12 月 31 日,對這個操作系統(tǒng)的支持現(xiàn)在在 CUDA 工具包中被棄用。 CentOS Linux 8 支持將在未來版本中完全取消。

關(guān)于作者

Rob Armstrong 是 CUDA 工具包的主要技術(shù)產(chǎn)品經(jīng)理。 20 多年來,他一直專注于使用異構(gòu)硬件平臺加速軟件,并對計算機體系結(jié)構(gòu)和硬件/軟件交互特別感興趣。

Arthy Sundaram 是 CUDA 平臺的技術(shù)產(chǎn)品經(jīng)理。她擁有哥倫比亞大學(xué)計算機科學(xué)碩士學(xué)位。她感興趣的領(lǐng)域是操作系統(tǒng)、編譯器和計算機體系結(jié)構(gòu)。

Fred Oh 是 CUDA 、 CUDA on WSL 和 CUDA Python 的高級產(chǎn)品營銷經(jīng)理。弗雷德?lián)碛屑又荽髮W(xué)戴維斯分校計算機科學(xué)和數(shù)學(xué)學(xué)士學(xué)位。他的職業(yè)生涯開始于一名 UNIX 軟件工程師,負(fù)責(zé)將內(nèi)核服務(wù)和設(shè)備驅(qū)動程序移植到 x86 體系結(jié)構(gòu)。他喜歡《星球大戰(zhàn)》、《星際迷航》和 NBA 勇士隊。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • NVIDIA
    +關(guān)注

    關(guān)注

    14

    文章

    5494

    瀏覽量

    109016
  • gpu
    gpu
    +關(guān)注

    關(guān)注

    28

    文章

    5090

    瀏覽量

    134392
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    嵌入式開發(fā)工具版本的選擇策略

    ,很多時候,還會親自下載安裝嘗鮮。 新版本有時候會引入一些bug,所以用新版本做項目一定要【慎重】,并不一定完全適合你的項目。 軟件工具是否需要升級到最新版本?我的觀點是:如果你做項
    發(fā)表于 11-25 06:11

    如何使用新版本J-Flash編程CW32 MCU

    1、從Segger公司官網(wǎng)下載安裝最新版本JLink驅(qū)動,比如V7.96a,安裝目錄下沒有JLinkDevices.xml文件。 2、在C:Users<用戶名>
    發(fā)表于 11-12 07:24

    【直播預(yù)告】RT-Trace 全新版本發(fā)布|ITM輸出 MemoryWatch 功能首發(fā)實測! | 問學(xué)直播

    RT-Trace迎來又一次重要更新!本次新版本帶來了兩項備受期待的功能——ITM輸出與MemoryWatch內(nèi)存監(jiān)控,讓調(diào)試可視化更高效、問題定位更精準(zhǔn)。為幫助開發(fā)者快速上手新特性
    的頭像 發(fā)表于 10-14 11:57 ?327次閱讀
    【直播預(yù)告】RT-Trace 全<b class='flag-5'>新版本</b>發(fā)布|ITM輸出  MemoryWatch <b class='flag-5'>功能</b>首發(fā)實測! | 問學(xué)直播

    Silicon Labs最新版本Simplicity Studio開發(fā)工具包SiSDK 2025.6.0增添多項無線技術(shù)協(xié)作

    ? Silicon Labs(芯科科技)在2025年第二季度發(fā)布了Simplicity Studio軟件開發(fā)工具的最新版本— SiSDK 2025.6.0。此次更新在無線協(xié)議棧、通信協(xié)議及開發(fā)工具
    的頭像 發(fā)表于 07-02 15:39 ?1975次閱讀

    戴爾數(shù)據(jù)保護軟件迎來全新版本

    無縫運行的異常檢測,一站式監(jiān)控多達150個系統(tǒng),額外的MFA多重身份驗證Dell PowerProtect Data Manager19.19全新版本現(xiàn)已到來!
    的頭像 發(fā)表于 06-27 13:55 ?678次閱讀

    普華基礎(chǔ)軟件開源汽車操作系統(tǒng)新版本代碼上線

    近日,第二十一屆上海國際汽車工業(yè)展覽會現(xiàn)場,開源車用操作系統(tǒng)新版本代碼上線儀式在中國電科展臺成功召開。全球首個開源智能駕駛操作系統(tǒng)微內(nèi)核龘EasyAda V2.1和首個規(guī)模化、量產(chǎn)級安全車控操作系統(tǒng)
    的頭像 發(fā)表于 04-30 09:17 ?784次閱讀

    普華基礎(chǔ)軟件開源車用操作系統(tǒng)迎來全新版本

    近日,普華基礎(chǔ)軟件開源車用操作系統(tǒng)媒體發(fā)布會在上海中國汽車會客廳召開——全球首個開源智能駕駛操作系統(tǒng)微內(nèi)核龘EasyAda、開源安全車控操作系統(tǒng)小滿EasyXMen全新版本正式發(fā)布?,F(xiàn)場,普華基礎(chǔ)軟件開源項目技術(shù)團隊專家就開源項目新版本技術(shù)亮點、新增
    的頭像 發(fā)表于 04-25 16:18 ?787次閱讀

    SOA架構(gòu)開發(fā)小助手PAVELINK.SOA-Converter 2.1.2新版本發(fā)布

    為提升汽車SOA架構(gòu)設(shè)計開發(fā)效率,優(yōu)化用戶體驗,我們對PAVELINK.SOA-Converter進行了全新升級。本次2.1.2新版本升級,聚焦于提升軟件性能、擴展功能特性及增強用戶交互體驗。
    的頭像 發(fā)表于 04-09 10:37 ?1239次閱讀
    SOA架構(gòu)開發(fā)小助手PAVELINK.SOA-Converter 2.1.2<b class='flag-5'>新版本</b>發(fā)布

    win7 64位系統(tǒng)STM32CubeMX安裝完成后數(shù)據(jù)無法升級到最新版本,怎么解決?

    win7 64位系統(tǒng) STM32CubeMX安裝完成后數(shù)據(jù)無法安裝,安裝較低版本后又無法升級到最新版本,這個界面出現(xiàn)閃退,無法輸入用戶名和密碼,導(dǎo)致無法升級。也試過下載STM32Cube FW
    發(fā)表于 03-10 07:04

    云計算開發(fā)工具包功能

    隨著云計算技術(shù)的不斷成熟,越來越多的企業(yè)開始將應(yīng)用和服務(wù)遷移到云端,以享受彈性計算資源、高可用性和成本效益等優(yōu)勢。為了加速這一進程,云計算服務(wù)提供商推出了各種開發(fā)工具包。下面,AI部落小編帶您了解云計算開發(fā)工具包的主要功能。
    的頭像 發(fā)表于 02-21 11:02 ?540次閱讀

    GUI Guider v1.9.0全新版本上線

    新年伊始,GUI Guider也迎來了全新版本!這一次,我們帶來了多項重磅更新,旨在為你提供更強大、更便捷的開發(fā)體驗。無論你是工業(yè)控制、智能家居,還是消費電子領(lǐng)域的開發(fā)者,這些更新都將為你的項目注入新的活力!
    的頭像 發(fā)表于 02-07 10:43 ?4482次閱讀

    新版本 IDE 的啟動速度變快了?原來是在背后做了這些!

    新版本 IntelliJ IDEA 中為提高性能而采取的措施,這些措施縮短了代碼可交互時間并使 IDE 從啟動開始就具有更高的響應(yīng)速度。
    的頭像 發(fā)表于 01-24 13:49 ?736次閱讀
    <b class='flag-5'>新版本</b> IDE 的啟動速度變快了?原來是在背后做了這些!

    Labview聲音和振動工具包示例文件Sound Level

    Labview 聲音和振動工具包示例文件,聲壓測試,有模擬和DAQ兩個文件。
    發(fā)表于 01-05 09:15 ?5次下載

    索尼發(fā)布空間現(xiàn)實顯示播放器新版本

    索尼于2024年12月發(fā)布適用于空間現(xiàn)實顯示屏ELF-SR1和ELF-SR2的空間現(xiàn)實顯示播放器新版本。
    的頭像 發(fā)表于 12-24 15:19 ?933次閱讀

    最新Simplicity SDK軟件開發(fā)工具包發(fā)布

    最新的SimplicitySDK軟件開發(fā)工具包已經(jīng)發(fā)布!此次更新針對SiliconLabs(芯科科技)第二代無線開發(fā)平臺帶來了包括藍牙6.0的信道探測(Channel Sounding
    的頭像 發(fā)表于 12-24 09:47 ?1451次閱讀