完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>
標簽 > gpu
圖形處理器(英語:Graphics Processing Unit,縮寫:GPU),又稱顯示核心、視覺處理器、顯示芯片,是一種專門在個人電腦、工作站、游戲機和一些移動設(shè)備(如平板電腦、智能手機等)上圖像運算工作的微處理器。
文章:4670個 瀏覽:130917次 帖子:301個
據(jù)科技部新一代人工智能發(fā)展研究中心發(fā)布的報告顯示,我國已發(fā)布79個參數(shù)規(guī)模超過10億的大模型,幾乎形成了百模大戰(zhàn)的局面。在大模型研發(fā)方面,中國14個省區(qū)...
NVIDIA CUDA深度神經(jīng)網(wǎng)絡(luò)庫實現(xiàn)高性能GPU加速
NVIDIA CUDA 深度神經(jīng)網(wǎng)絡(luò)庫(cuDNN)是一個 GPU 加速的深度神經(jīng)網(wǎng)絡(luò)基元庫,能夠以高度優(yōu)化的方式實現(xiàn)標準例程(如前向和反向卷積、池化層...
2022-07-23 標簽:神經(jīng)網(wǎng)絡(luò)gpu計算機視覺 1732 0
高性能MCU解決方案可實現(xiàn)汽車駕駛艙里的智能世界
隨著車載信息系統(tǒng)的高度發(fā)展,HMI功能強且精度高的顯示器的需求應(yīng)運而生,汽車駕駛座正在向“綜合駕駛艙”發(fā)展。瑞薩電子與車載信息系統(tǒng)的發(fā)展同步提供能實現(xiàn)更...
Merlin HugeCTR 分級參數(shù)服務(wù)器簡介
參數(shù)服務(wù)器是推薦系統(tǒng)的重要組成部分,但是目前的訓練端參數(shù)服務(wù)器由于高延遲和同步問題無法有效解決推理部署中模型過大的瓶頸。
英特爾FPGA 提供各類可配置的嵌入式SRAM、高速收發(fā)器、高速I/O、邏輯模塊和路由。嵌入式知識產(chǎn)權(quán)(IP)與出色的軟件工具相結(jié)合,減少了FPGA開發(fā)...
圖形處理單元(GPU)不斷迭代更新,其中的晶體管數(shù)目也不斷增加以提高處理器性能。如今這個數(shù)目已達到數(shù)百億的級別,與此同時,功率需求也相應(yīng)呈指數(shù)級增長,這...
德思特分享 突破FPGA限制:德思特TS-M4i系列數(shù)字化儀利用GPU加速實現(xiàn)高效塊平均處理
本白皮書將展示如何使用德思特TS-M4i系列數(shù)字化儀的高速PCIe流模式來在軟件中實現(xiàn)塊平均處理,從而突破FPGA的限制。我們用了TS-M4i.2230...
試想一下,巖石、糖果和藥片之間有什么共同之處呢?首先,它們都是離散固體。其次,我們還可使用Rocky DEM對它們的動態(tài)行為和相互作用進行仿真。
一文詳解多模態(tài)大模型發(fā)展及高頻因子計算加速GPU算力 | 英偉達顯卡被限,華為如何力挽狂瀾?
近年來,全球范圍內(nèi)的芯片禁令不斷升級,給許多企業(yè)和科研機構(gòu)帶來了很大的困擾,需要在技術(shù)層面進行創(chuàng)新和突破。一方面,可以探索使用國產(chǎn)芯片和其他不受限制的芯...
用于下一代汽車專用集成電路(ASIC)的嵌入式現(xiàn)場可編程邏輯門陣列(eFPGA)
用于下一代汽車專用集成電路(ASIC)的嵌入式現(xiàn)場可編程邏輯門陣列(eFPGA)
ABI在2022年的調(diào)查顯示,手機游戲用戶會從26億增長到2030年的39億,至2026年85%的游戲玩家首選在手機上玩游戲。顯然,光線追蹤成為手機征服...
CPU,GPU,F(xiàn)PGA:用英特爾線程構(gòu)建塊管理字母表
Find out how Intel? Threading Building Blocks (Intel? TBB) can help you addr...
云服務(wù)、OEM 借助 NVIDIA AI讓AI訓練更上層樓
借助 NVIDIA AI,戴爾、浪潮、Microsoft Azure 和 Supermicro 在今天發(fā)布的新 MLPerf 基準測試中創(chuàng)下快速訓練 A...
基于OpenGL操作GPU來提升圖片模糊性能實現(xiàn)
本篇文章介紹了由單純的在JS中用正態(tài)分布公式操作像素點實現(xiàn)模糊效果,引出性能問題,最后到基于OpenGL實現(xiàn)模糊效果的優(yōu)化,最后性能上也從模糊一張大圖片...
開源方案低成本復現(xiàn)ChatGPT流程,僅需1.6GB顯存即可體驗
若使用上述相同硬件資源,Colossal-AI 則能以更短時間進行訓練,節(jié)省訓練成本,加速產(chǎn)品迭代。為了讓更多開發(fā)者體驗復現(xiàn) ChatGPT 模型,除 ...
MixFormerV2:基于Transformer的高效跟蹤器
我們通過簡潔有效的模型結(jié)構(gòu)設(shè)計和高效的基于知識蒸餾的模型壓縮,對于現(xiàn)有的 MixFormer 模型進行了大幅度的輕量化提出了 MixFormerV2,同...
FlashAttenion-V3: Flash Decoding詳解
因此,本文提出了Flash-Decoding,可以推理過程中顯著加速attention操作(例如長序列生成速度提高8倍)。其主要思想是最大化并行加載ke...
編輯推薦廠商產(chǎn)品技術(shù)軟件/工具OS/語言教程專題
電機控制 | DSP | 氮化鎵 | 功率放大器 | ChatGPT | 自動駕駛 | TI | 瑞薩電子 |
BLDC | PLC | 碳化硅 | 二極管 | OpenAI | 元宇宙 | 安森美 | ADI |
無刷電機 | FOC | IGBT | 逆變器 | 文心一言 | 5G | 英飛凌 | 羅姆 |
直流電機 | PID | MOSFET | 傳感器 | 人工智能 | 物聯(lián)網(wǎng) | NXP | 賽靈思 |
步進電機 | SPWM | 充電樁 | IPM | 機器視覺 | 無人機 | 三菱電機 | ST |
伺服電機 | SVPWM | 光伏發(fā)電 | UPS | AR | 智能電網(wǎng) | 國民技術(shù) | Microchip |
Arduino | BeagleBone | 樹莓派 | STM32 | MSP430 | EFM32 | ARM mbed | EDA |
示波器 | LPC | imx8 | PSoC | Altium Designer | Allegro | Mentor | Pads |
OrCAD | Cadence | AutoCAD | 華秋DFM | Keil | MATLAB | MPLAB | Quartus |
C++ | Java | Python | JavaScript | node.js | RISC-V | verilog | Tensorflow |
Android | iOS | linux | RTOS | FreeRTOS | LiteOS | RT-THread | uCOS |
DuerOS | Brillo | Windows11 | HarmonyOS |