完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>
標(biāo)簽 > cuda
文章:98個 瀏覽:14089次 帖子:19個
單精度矩陣乘法(SGEMM)幾乎是每一位學(xué)習(xí) CUDA 的同學(xué)繞不開的案例,這個經(jīng)典的計(jì)算密集型案例可以很好地展示 GPU 編程中常用的優(yōu)化技巧。本文將...
無需實(shí)例或類級別3D模型的對新穎物體的6D姿態(tài)追蹤
跟蹤RGBD視頻中物體的6D姿態(tài)對機(jī)器人操作很重要。然而,大多數(shù)先前的工作通常假設(shè)目標(biāo)對象的CAD 模型,至少類別級別,可用于離線訓(xùn)練或在線測試階段模板匹配。
協(xié)作組編程模型的特點(diǎn)及應(yīng)用
協(xié)作組編程模型描述了 CUDA 線程塊內(nèi)和跨線程塊的同步模式。 它為應(yīng)用程序提供了定義它們自己的線程組的方法,以及同步它們的接口。 它還提供了強(qiáng)制執(zhí)行某...
運(yùn)行時在cudart庫中實(shí)現(xiàn),該庫通過cudart靜態(tài)地鏈接到應(yīng)用程序。
2023-05-19 標(biāo)簽:MPSCUDAcache技術(shù) 1875 0
銘瑄這款RTX 4070 MGG OC12G S0的設(shè)計(jì)和幾位師兄如出一轍,搭載了Mega Freeze VC散熱系統(tǒng),正面三個10厘米風(fēng)扇,均有11片...
GPU和CPU之間的功能差異之所以存在,是因?yàn)樗鼈兊脑O(shè)計(jì)目標(biāo)不同。雖然CPU被設(shè)計(jì)為盡可能快地執(zhí)行一系列操作(稱為線程),并且可以并行執(zhí)行幾十個線程,但...
計(jì)算能力9.0中引入的線程塊集群為線程塊集群中的線程提供了訪問集群中所有參與線程塊的共享內(nèi)存的能力。
總結(jié)FasterTransformer Encoder優(yōu)化技巧
FasterTransformer BERT 包含優(yōu)化的 BERT 模型、高效的 FasterTransformer 和 INT8 量化推理。
算力芯片的cuda有何難點(diǎn)和優(yōu)點(diǎn)
CUDA之所以會成為算力芯片硬件廠商必須要認(rèn)真考慮的一個選擇,最直接的原因,是其已經(jīng)實(shí)現(xiàn)了與算法客戶的強(qiáng)綁定。眾多算法工程師已經(jīng)習(xí)慣了CUDA提供的工具...
2023-08-16 標(biāo)簽:gpu芯片設(shè)計(jì)CUDA 1513 0
構(gòu)造具有動態(tài)參數(shù)的CUDA圖表
通過這種構(gòu)建CUDA圖的方法,由CUDA內(nèi)核和CUDA內(nèi)存操作形成的圖節(jié)點(diǎn)通過調(diào)用cudaGraphAdd*節(jié)點(diǎn)API添加到圖中,其中*被替換為節(jié)點(diǎn)...
神經(jīng)網(wǎng)絡(luò)能加速的有很多,當(dāng)然使用硬件加速是最可觀的了,而目前除了專用的NPU(神經(jīng)網(wǎng)絡(luò)加速單元),就屬于GPU對神經(jīng)網(wǎng)絡(luò)加速效果最好了
2024-03-05 標(biāo)簽:神經(jīng)網(wǎng)絡(luò)gpusram 1193 0
基于CUDA技術(shù)的視頻顯示系統(tǒng)的設(shè)計(jì)方案
近年來隨著大屏幕顯示技術(shù)在各領(lǐng)域應(yīng)用的逐步深入,市場已經(jīng)不滿足單一的影片展示,更多的轉(zhuǎn)向了對互動性更強(qiáng)的計(jì)算機(jī)桌面環(huán)境的融合顯示上來。而目前市場上主流的...
NVIDIA DOCA GPUNetIO庫如何克服以前DPDK解決方案中的一些限制
網(wǎng)絡(luò)數(shù)據(jù)包的實(shí)時 GPU 處理是一種適用于幾個不同應(yīng)用領(lǐng)域的技術(shù),包括信號處理、網(wǎng)絡(luò)安全、信息收集和輸入重建。
2023-06-21 標(biāo)簽:處理器存儲器NVIDIA技術(shù) 1119 0
根據(jù)我們的實(shí)驗(yàn)分析,我們認(rèn)為實(shí)現(xiàn)這一目標(biāo)的關(guān)鍵在于提升檢測器在 BEV 空間和 2D 空間的適應(yīng)性。這種適應(yīng)性是針對 query 而言的,即對于不同的 ...
編程模型中介紹了核心語言擴(kuò)展。它們允許程序員將內(nèi)核定義為c++函數(shù),并在每次調(diào)用函數(shù)時使用一些新的語法來指定網(wǎng)格和塊維度。
編輯推薦廠商產(chǎn)品技術(shù)軟件/工具OS/語言教程專題
電機(jī)控制 | DSP | 氮化鎵 | 功率放大器 | ChatGPT | 自動駕駛 | TI | 瑞薩電子 |
BLDC | PLC | 碳化硅 | 二極管 | OpenAI | 元宇宙 | 安森美 | ADI |
無刷電機(jī) | FOC | IGBT | 逆變器 | 文心一言 | 5G | 英飛凌 | 羅姆 |
直流電機(jī) | PID | MOSFET | 傳感器 | 人工智能 | 物聯(lián)網(wǎng) | NXP | 賽靈思 |
步進(jìn)電機(jī) | SPWM | 充電樁 | IPM | 機(jī)器視覺 | 無人機(jī) | 三菱電機(jī) | ST |
伺服電機(jī) | SVPWM | 光伏發(fā)電 | UPS | AR | 智能電網(wǎng) | 國民技術(shù) | Microchip |
Arduino | BeagleBone | 樹莓派 | STM32 | MSP430 | EFM32 | ARM mbed | EDA |
示波器 | LPC | imx8 | PSoC | Altium Designer | Allegro | Mentor | Pads |
OrCAD | Cadence | AutoCAD | 華秋DFM | Keil | MATLAB | MPLAB | Quartus |
C++ | Java | Python | JavaScript | node.js | RISC-V | verilog | Tensorflow |
Android | iOS | linux | RTOS | FreeRTOS | LiteOS | RT-THread | uCOS |
DuerOS | Brillo | Windows11 | HarmonyOS |