聊聊GPU通信技術(shù)

最近人工智能大火，AI 應(yīng)用所涉及的技術(shù)能力包括語音、圖像、視頻、NLP 等多方面，而這些都需要強(qiáng)大的計(jì)算資源支持。AI 技術(shù)對算力的需求是非常龐大的，雖然 GPU 的計(jì)算能力在持續(xù)提升，但是對于 AI 來說，單卡的計(jì)算能力就算再強(qiáng)，也是有極限的，這就需要多 GPU 組合。而 GPU 多卡的組合，主要分為單個(gè)服務(wù)器多張 GPU 卡和多個(gè)服務(wù)器，每個(gè)服務(wù)器多張卡這兩種情況，無論是單機(jī)多卡還是多機(jī)多卡，GPU 之間需要有超強(qiáng)的通信支持。接下來，我們就來聊聊 GPU 通信技術(shù)。

01. 單機(jī)多卡GPU通信*

GPU Direct

GPU Direct 是 NVIDIA 開發(fā)的一項(xiàng)技術(shù)，可實(shí)現(xiàn) GPU 與其他設(shè)備（例如網(wǎng)絡(luò)接口卡 (NIC) 和存儲設(shè)備）之間的直接通信和數(shù)據(jù)傳輸，而不涉及 CPU。

傳統(tǒng)上，當(dāng)數(shù)據(jù)需要在 GPU 和另一個(gè)設(shè)備之間傳輸時(shí)，數(shù)據(jù)必須通過 CPU，從而導(dǎo)致潛在的瓶頸并增加延遲。使用 GPUDirect，網(wǎng)絡(luò)適配器和存儲驅(qū)動(dòng)器可以直接讀寫 GPU 內(nèi)存，減少不必要的內(nèi)存消耗，減少 CPU 開銷并降低延遲，從而顯著提高性能。GPU Direct 技術(shù)包括 GPUDirect Storage、GPUDirect RDMA、GPUDirect P2P 和 GPUDirect 視頻。

GPUDirect Storage

GPUDirect Storage 允許存儲設(shè)備和 GPU 之間進(jìn)行直接數(shù)據(jù)傳輸，繞過 CPU，減少數(shù)據(jù)傳輸?shù)难舆t和 CPU 開銷。

通過 GPUDirect Storage，GPU 可以直接從存儲設(shè)備（如固態(tài)硬盤（SSD）或非易失性內(nèi)存擴(kuò)展（NVMe）驅(qū)動(dòng)器）訪問數(shù)據(jù)，而無需將數(shù)據(jù)先復(fù)制到 CPU 的內(nèi)存中。這種直接訪問能夠?qū)崿F(xiàn)更快的數(shù)據(jù)傳輸速度，并更高效地利用 GPU 資源。

GPUDirect Storage 的主要特點(diǎn)和優(yōu)勢包括：

減少 CPU 參與：通過繞過 CPU，實(shí)現(xiàn) GPU 和存儲設(shè)備之間的直接通信，GPUDirect Storage 減少了 CPU 開銷，并釋放 CPU 資源用于其他任務(wù)，從而改善系統(tǒng)的整體性能。

低延遲數(shù)據(jù)訪問：GPUDirect Storage 消除了數(shù)據(jù)通過 CPU 的傳輸路徑，從而最小化了數(shù)據(jù)傳輸?shù)难舆t。這對于實(shí)時(shí)分析、機(jī)器學(xué)習(xí)和高性能計(jì)算等對延遲敏感的應(yīng)用非常有益。

提高存儲性能：通過允許 GPU 直接訪問存儲設(shè)備，GPUDirect Storage 實(shí)現(xiàn)了高速數(shù)據(jù)傳輸，可以顯著提高存儲性能，加速數(shù)據(jù)密集型工作負(fù)載的處理速度。

增強(qiáng)的可擴(kuò)展性：GPUDirect Storage 支持多 GPU 配置，允許多個(gè) GPU 同時(shí)訪問存儲設(shè)備。這種可擴(kuò)展性對于需要大規(guī)模并行處理和數(shù)據(jù)分析的應(yīng)用至關(guān)重要。

兼容性和生態(tài)系統(tǒng)支持：GPUDirect Storage 設(shè)計(jì)用于與各種存儲協(xié)議兼容，包括 NVMe、NVMe over Fabrics和網(wǎng)絡(luò)附加存儲（NAS）。它得到了主要存儲供應(yīng)商的支持，并集成到流行的軟件框架（如NVIDIA CUDA）中，以簡化與現(xiàn)有的 GPU 加速應(yīng)用程序的集成。

GPUDirect P2P

某些工作負(fù)載需要位于同一服務(wù)器中的兩個(gè)或多個(gè) GPU 之間進(jìn)行數(shù)據(jù)交換，在沒有 GPUDirect P2P 技術(shù)的情況下，來自 GPU 的數(shù)據(jù)將首先通過 CPU 和 PCIe 總線復(fù)制到主機(jī)固定的共享內(nèi)存。然后，數(shù)據(jù)將通過 CPU 和 PCIe 總線從主機(jī)固定的共享內(nèi)存復(fù)制到目標(biāo) GPU，數(shù)據(jù)在到達(dá)目的地之前需要被復(fù)制兩次、

有了 GPUDirect P2P 通信技術(shù)后，將數(shù)據(jù)從源 GPU 復(fù)制到同一節(jié)點(diǎn)中的另一個(gè) GPU 不再需要將數(shù)據(jù)臨時(shí)暫存到主機(jī)內(nèi)存中。如果兩個(gè) GPU 連接到同一 PCIe 總線，GPUDirect P2P 允許訪問其相應(yīng)的內(nèi)存，而無需 CPU 參與。前者將執(zhí)行相同任務(wù)所需的復(fù)制操作數(shù)量減半。

NVLink

在 GPUDirect P2P 技術(shù)中，多個(gè) GPU 通過 PCIe 直接與 CPU 相連，而 PCIe 3.0*16 的雙向帶寬不足 32GB/s，當(dāng)訓(xùn)練數(shù)據(jù)不斷增長時(shí)，PCIe 的帶寬滿足不了需求，會(huì)逐漸成為系統(tǒng)瓶頸。為提升多 GPU 之間的通信性能，充分發(fā)揮 GPU 的計(jì)算性能，NVIDIA 于 2016 年發(fā)布了全新架構(gòu)的 NVLink。NVLink 是一種高速、高帶寬的互連技術(shù)，用于連接多個(gè) GPU 之間或連接 GPU 與其他設(shè)備（如CPU、內(nèi)存等）之間的通信。NVLink 提供了直接的點(diǎn)對點(diǎn)連接，具有比傳統(tǒng)的 PCIe 總線更高的傳輸速度和更低的延遲。

高帶寬和低延遲：NVLink 提供了高達(dá) 300 GB/s 的雙向帶寬，將近 PCle 3.0 帶寬的 10 倍。點(diǎn)對點(diǎn)連接超低延遲，可實(shí)現(xiàn)快速、高效的數(shù)據(jù)傳輸和通信。

GPU 間通信：NVLink 允許多個(gè) GPU 之間直接進(jìn)行點(diǎn)對點(diǎn)的通信，無需通過主機(jī)內(nèi)存或 CPU 進(jìn)行數(shù)據(jù)傳輸。

內(nèi)存共享：NVLink 還支持 GPU 之間的內(nèi)存共享，使得多個(gè) GPU 可以直接訪問彼此的內(nèi)存空間。

彈性連接：NVLink 支持多種連接配置，包括 2、4、6 或 8 個(gè)通道，可以根據(jù)需要進(jìn)行靈活的配置和擴(kuò)展。這使得 NVLink 適用于不同規(guī)模和需求的系統(tǒng)配置。

NVSwitch

NVLink 技術(shù)無法使單服務(wù)器中 8 個(gè) GPU 達(dá)到全連接，為解決該問題，NVIDIA 在 2018 年發(fā)布了 NVSwitch，實(shí)現(xiàn)了 NVLink 的全連接。NVIDIA NVSwitch 是首款節(jié)點(diǎn)交換架構(gòu)，可支持單個(gè)服務(wù)器節(jié)點(diǎn)中 16 個(gè)全互聯(lián)的 GPU，并可使全部 8 個(gè) GPU 對分別達(dá)到 300GB/s 的速度同時(shí)進(jìn)行通信。

△ NVSwitch 全連接拓?fù)?/p>

***02. ***多機(jī)多卡GPU通信

RDMA

AI 計(jì)算對算力需求巨大，多機(jī)多卡的計(jì)算是一個(gè)常態(tài)，多機(jī)間的通信是影響分布式訓(xùn)練的一個(gè)重要指標(biāo)。在傳統(tǒng)的 TCP/IP 網(wǎng)絡(luò)通信中，數(shù)據(jù)發(fā)送方需要將數(shù)據(jù)進(jìn)行多次內(nèi)存拷貝，并經(jīng)過一系列的網(wǎng)絡(luò)協(xié)議的數(shù)據(jù)包處理工作；數(shù)據(jù)接收方在應(yīng)用程序中處理數(shù)據(jù)前，也需要經(jīng)過多次內(nèi)存拷貝和一系列的網(wǎng)絡(luò)協(xié)議的數(shù)據(jù)包處理工作。經(jīng)過這一系列的內(nèi)存拷貝、數(shù)據(jù)包處理以及網(wǎng)絡(luò)傳輸延時(shí)等，服務(wù)器間的通信時(shí)延往往在毫秒級別，不能夠滿足多機(jī)多卡場景對于網(wǎng)絡(luò)通信的需求。

RDMA（Remote Direct Memory Access）是一種繞過遠(yuǎn)程主機(jī)而訪問其內(nèi)存中數(shù)據(jù)的技術(shù)，解決網(wǎng)絡(luò)傳輸中數(shù)據(jù)處理延遲而產(chǎn)生的一種遠(yuǎn)端內(nèi)存直接訪問技術(shù)。

目前 RDMA 有三種不同的技術(shù)實(shí)現(xiàn)方式：

InfiniBand（IB）：IB 是一種高性能互連技術(shù)，它提供了原生的 RDMA 支持。IB 網(wǎng)絡(luò)使用專用的 IB 適配器和交換機(jī)，通過 RDMA 操作實(shí)現(xiàn)節(jié)點(diǎn)之間的高速直接內(nèi)存訪問和數(shù)據(jù)傳輸。

RoCE（RDMA over Converged Ethernet）：RoCE是在以太網(wǎng)上實(shí)現(xiàn) RDMA 的技術(shù)。它使用標(biāo)準(zhǔn)的以太網(wǎng)作為底層傳輸介質(zhì)，并通過使用 RoCE 適配器和適當(dāng)?shù)膮f(xié)議棧來實(shí)現(xiàn) RDMA 功能。

iWARP：iWARP 是基于 TCP/IP 協(xié)議棧的 RDMA 實(shí)現(xiàn)。它使用普通的以太網(wǎng)適配器和標(biāo)準(zhǔn)的網(wǎng)絡(luò)交換機(jī)，并通過在 TCP/IP 協(xié)議棧中實(shí)現(xiàn) RDMA 功能來提供高性能的遠(yuǎn)程內(nèi)存訪問和數(shù)據(jù)傳輸。

GPUDirect RDMA

GPUDirect RDMA 結(jié)合了 GPU 加速計(jì)算和 RDMA（Remote Direct Memory Access）技術(shù)，實(shí)現(xiàn)了在 GPU 和 RDMA 網(wǎng)絡(luò)設(shè)備之間直接進(jìn)行數(shù)據(jù)傳輸和通信的能力。它允許 GPU 直接訪問 RDMA 網(wǎng)絡(luò)設(shè)備中的數(shù)據(jù)，無需通過主機(jī)內(nèi)存或 CPU 的中介。

GPUDirect RDMA 通過繞過主機(jī)內(nèi)存和 CPU，直接在 GPU 和 RDMA 網(wǎng)絡(luò)設(shè)備之間進(jìn)行數(shù)據(jù)傳輸，顯著降低傳輸延遲，加快數(shù)據(jù)交換速度，并可以減輕 CPU 負(fù)載，釋放 CPU 的計(jì)算能力。另外，GPUDirect RDMA 技術(shù)允許 GPU 直接訪問 RDMA 網(wǎng)絡(luò)設(shè)備中的數(shù)據(jù)，避免了數(shù)據(jù)在主機(jī)內(nèi)存中的復(fù)制，提高了數(shù)據(jù)傳輸?shù)膸捓寐省?/p>

IPOIB

IPOIB（IP over InfiniBand）是一種在 InfiniBand 網(wǎng)絡(luò)上運(yùn)行 IP 協(xié)議的技術(shù)。它將標(biāo)準(zhǔn)的 IP 協(xié)議棧與 IB 互連技術(shù)相結(jié)合，使得在 IB 網(wǎng)絡(luò)上的節(jié)點(diǎn)能夠使用 IP 協(xié)議進(jìn)行通信和數(shù)據(jù)傳輸。

IPOIB 提供了基于 RDMA 之上的 IP 網(wǎng)絡(luò)模擬層，允許應(yīng)用無修改的運(yùn)行在 IB 網(wǎng)絡(luò)上。但是，IPoIB 仍然經(jīng)過內(nèi)核層（IP Stack），會(huì)產(chǎn)生大量系統(tǒng)調(diào)用，并且涉及 CPU 中斷，因此 IPoIB 性能比 RDMA 通信方式性能要低，大多數(shù)應(yīng)用都會(huì)采用 RDMA 方式獲取高帶寬低延時(shí)的收益，少數(shù)的關(guān)鍵應(yīng)用會(huì)采用 IPoIB 方式通信。

在大規(guī)模計(jì)算中，單機(jī)多卡場景下使用 GPUDiect、NVLink 技術(shù)，分布式場景下使用 GPUDirect RDMA 技術(shù)，可以大大縮短通信時(shí)間，提升整體性能。

審核編輯：湯梓紅

閱讀全文

通信技術(shù)(91499) 通信技術(shù)(91499)
gpu(126253) gpu(126253)
服務(wù)器(82166) 服務(wù)器(82166)
AI(263610) AI(263610)
人工智能(229980) 人工智能(229980)

使用ESP32實(shí)現(xiàn)藍(lán)牙通信

上次給大家分享了如何使用ESP32實(shí)現(xiàn)UDP通信，今天跟大家聊聊如何使用ESP32實(shí)現(xiàn)藍(lán)牙通信。

2022-11-21 09:31:29

11781

聊聊 220V交流過零檢測

聊聊過零檢測，以及如何實(shí)現(xiàn)過零檢測 ...... by 矜辰所致

2023-06-06 11:20:30

2954

5G通信技術(shù)的應(yīng)用有哪些？

什么是5G無線通信技術(shù)？5G通信技術(shù)的應(yīng)用有哪些？

2021-05-21 06:22:15

GPU

，GPU已經(jīng)不再局限于3D圖形處理了，GPU通用計(jì)算技術(shù)發(fā)展已經(jīng)引起業(yè)界不少的關(guān)注，事實(shí)也證明在浮點(diǎn)運(yùn)算、并行計(jì)算等部分計(jì)算方面，GPU可以提供數(shù)十倍乃至于上百倍于CPU的性能。GPU通用計(jì)算方面

2016-01-16 08:59:11

GPU architecture

上學(xué)的時(shí)候課本里都是CPU，沒有GPU的。現(xiàn)在當(dāng)做一個(gè)業(yè)余愛好。有興趣的可以看看。GPU架構(gòu)

2015-02-13 10:16:47

GPU-Z可以監(jiān)控每個(gè)vGPU的總GPU利用率嗎？

我同時(shí)運(yùn)行4個(gè)VM，每個(gè)vGPU是m60-2Q。所有虛擬機(jī)都運(yùn)行bechmark測試。我使用Techpowerup GPU-Z監(jiān)控每個(gè)vGPU。我發(fā)現(xiàn)了一個(gè)有趣的結(jié)果。如果我將所有vGPU利用率

2018-09-19 16:59:17

GPU100HF120D1SE

GPU100HF120D1SE

2023-03-29 17:17:40

GPU150HF120D1SE

GPU150HF120D1SE

2023-03-29 17:17:40

GPU150HF120D2

GPU150HF120D2

2023-03-28 18:08:25

GPU300HF120D2

GPU300HF120D2

2023-03-29 17:17:40

GPU450HF120D2SE

GPU450HF120D2SE

2023-03-28 18:08:25

GPU八大主流的應(yīng)用場景

產(chǎn)生新需求，將帶來高性能GPU市場快速增長。GPU分類與主要廠商，資料來源：架構(gòu)師技術(shù)聯(lián)盟、華西證券研究所云端AI服務(wù)器AI服務(wù)器通常搭載GPU、FPGA、ASIC等加速芯片，利用CPU與加速芯片的組合

2021-12-07 10:04:11

GPU加速matlab程序

最近遇到了一個(gè)加速matlab程序的問題，不知道如何利用GPU，以及使用GPU的先決條件，是不是GPU加速必須要用cuda，最重要的是只用GPUArray和gather函數(shù)，加速效果不知道如何，主要是有多個(gè)函數(shù)調(diào)用關(guān)系？哪位前輩能指導(dǎo)一下？

2019-03-30 11:21:12

GPU和CPU的區(qū)別是什么

GPU是如何工作的GPU與DSP區(qū)別GPU和CPU的區(qū)別是什么

2021-01-05 06:15:15

GPU爆炸式發(fā)展背后的深層原因？

Bifrost架構(gòu)如何提高效率和性能？Mali-G71如何通過創(chuàng)新技術(shù)來提升GPU性能？GPU爆炸式發(fā)展背后的深層原因？

2021-03-11 06:48:49

gpu工作原理是什么？

gpu工作原理是什么？

2021-05-31 06:17:18

聊聊CMSIS

這次我們來聊聊CMSIS。之前在Kile環(huán)境下創(chuàng)建STM32工程的時(shí)候，對有些文件的加入總不是很了解，書上或網(wǎng)上建立工程的教程對于這些文件的加入也是一筆帶過，或者直接不說。對于類似名叫

2021-08-24 07:50:23

聊聊stm32的入門學(xué)習(xí)路線

絕大部分的stm32的學(xué)習(xí)者是在入門階段的，所以今天我們就來聊聊stm32的入門學(xué)習(xí)路線。先來看個(gè)圖，相信會(huì)有所了解。首先學(xué)習(xí)stm32 不管是C語言還是匯編肯定跑不了的所以C語言一樣要打好基礎(chǔ)...

2021-08-03 07:08:01

聊聊使用功率FET應(yīng)該注意的問題有哪些

型號。今天中港揚(yáng)盛技術(shù)員就跟大家聊聊使用功率FET應(yīng)該注意的問題有哪些。電路的綜合成本超過雙極型晶體管,尤其是在開關(guān)頻率提高的情況下,功率FET是不可缺少的元件。功率FET用于開關(guān)電源時(shí),若使用雙極型晶體...

2021-11-12 07:10:09

聊聊復(fù)位電路

時(shí)鐘電路我第一篇博客已經(jīng)說講過了，今天我們來聊聊復(fù)位電路。當(dāng)然，復(fù)位電路博大精深，并...

2022-01-17 07:50:18

聊聊字符串

大家好，我是驚覺，今天聊聊字符串。字符串的使用場景非常之多，人機(jī)交互和雙機(jī)通信都會(huì)用到。比如：通過串口向單片機(jī)發(fā)送指令，以執(zhí)行操作或配置參數(shù)。單片機(jī)讀取傳感器數(shù)據(jù)，數(shù)據(jù)格式是字符串。一般GPS數(shù)據(jù)

2022-02-28 06:52:09

聊聊存儲器的相關(guān)知識

虛擬地址物理地址等眾多地址及MMU相關(guān)知識先聊聊存儲器STM32單片機(jī)存儲器關(guān)于編譯器生成的文件數(shù)據(jù)在存儲器上的存儲結(jié)構(gòu)物理地址、虛擬地址、線性地址和邏輯地址物理地址虛擬地址邏輯地址線性地址這些地址

2022-02-11 07:51:30

聊聊環(huán)形緩存在單片機(jī)程序中的使用

片頭因?yàn)榄h(huán)形緩存在單片機(jī)程序中的使用是非常有效的，非常有用的，關(guān)于這個(gè)話題在此專門開一文章來聊聊這個(gè)話題。環(huán)形緩存的用途主要是來緩存數(shù)據(jù)，而需要緩存數(shù)據(jù)的地方在單片機(jī)程序中應(yīng)用最多的就是通信方面了

2021-12-06 08:29:16

ARM架構(gòu)的GPU和臺式機(jī)的GPU有什么區(qū)別

1：移動(dòng)GPU（指的是ARM處理器集成的GPU）和獨(dú)立的PC的GPU的區(qū)別？除了架構(gòu)，就拿視頻解碼來說，為什么ARM的處理器的GPU可以實(shí)現(xiàn)硬件解碼4K分辨率的視頻，或者試吃4K的顯示分辨率。而英偉

2020-07-18 08:04:38

CPU和GPU擅長和不擅長的地方

CPU和GPU都是具有運(yùn)算能力的芯片，CPU更像“通才”——指令運(yùn)算(執(zhí)行)為重+ 數(shù)值運(yùn)算，GPU更像“專才”——圖形類數(shù)值計(jì)算為核心。在不同類型的運(yùn)算方面的速度也就決定了它們的能力——“擅長

2017-12-03 20:08:47

CPU和GPU擅長和不擅長的地方

；游戲中人工智能，物理模擬等等；3D建模-光線追蹤渲染；虛擬化技術(shù)——抽象硬件，同時(shí)運(yùn)行多個(gè)操作系統(tǒng)或者一個(gè)操作系統(tǒng)的多個(gè)副本等等。 GPU擅長的：圖形類矩陣運(yùn)算，非圖形類并行數(shù)值計(jì)算，高端3D游戲

2017-12-03 15:43:58

Imagination Rogue GPU技術(shù)有哪些優(yōu)勢？

PowerVR 6系列GPU與競爭對手Mali-T600系列GPU的規(guī)格對比PowerVR的看家本領(lǐng)——TBDR渲染技術(shù)

2021-02-26 07:39:38

Intel即將推出的GPU將與Arm兼容

，英特爾和SiPearl已經(jīng)為CPU和GPU優(yōu)化了一個(gè)低延遲的通信管道。Compute Express Link互連規(guī)范促進(jìn)了CPU、GPU和其他加速器芯片之間的通信。英特爾希望在GPU方面超越英偉達(dá)，而

2022-03-29 14:41:33

RDSH高清媒體的使用需要GPU嗎？

是基于網(wǎng)絡(luò)的），但不清楚的部分是能夠查看高清媒體（通過瀏覽器或媒體播放器）。 - 這種類型的使用需要GPU嗎？ - 如果沒有，GPU會(huì)從CPU卸載這類工作嗎？或者那不起作用？ - 如果我使用GPU，單個(gè)

2018-09-27 15:56:33

RT9198-4GPU5

RT9198-4GPU5 - 300mA, Low Noise, Ultra-Fast CMOS LDO Regulator - Richtek Technology Corporation

2022-11-04 17:22:44

RT9198-4GPU5R

RT9198-4GPU5R - 300mA, Low Noise, Ultra-Fast CMOS LDO Regulator - Richtek Technology Corporation

2022-11-04 17:22:44

RT9198A-4GPU5R

RT9198A-4GPU5R - 300mA, Low Noise, Ultra-Fast CMOS LDO Regulator - Richtek Technology Corporation

2022-11-04 17:22:44

TensorFlow指定CPU和GPU設(shè)備操作詳解

TensorFlow 支持 CPU 和 GPU。它也支持分布式計(jì)算?？梢栽谝粋€(gè)或多個(gè)計(jì)算機(jī)系統(tǒng)的多個(gè)設(shè)備上使用 TensorFlow。TensorFlow 將支持的 CPU 設(shè)備命名為

2020-07-28 14:33:28

USS通信協(xié)議的基本內(nèi)容

USS通信技術(shù)作為一種低成本的簡單驅(qū)動(dòng)控制技術(shù)，在工業(yè)現(xiàn)場有著廣泛的應(yīng)用。今天這篇文章，我們就和大家一起聊聊USS通信協(xié)議的基本內(nèi)容。

2021-01-19 06:45:32

VMware GPU分配/在GPU 1之前首先使用GPU 0

嗨，我在ESX 6中使用GRID K2。Atm有像GPU0和GPU1之間的負(fù)載平衡。如果我在主機(jī)上打開2 K240q，則第一個(gè)VM被分配給GPU0，即第二個(gè)GPU1。我無法啟動(dòng)此主機(jī)上的任何

2018-09-10 17:14:36

XS GPU是什么？XS GPU的主要特性包括哪些？

請問一下XS GPU是什么？XS GPU的主要特性包括哪些？XS GPU具備哪些功能？主要應(yīng)用于哪些領(lǐng)域？

2021-07-01 06:55:05

XS GPU系統(tǒng)產(chǎn)品介紹

在有些人看來，Imagination Technologies是在移動(dòng)端領(lǐng)域的知名GPU供應(yīng)商。其實(shí)，我們的GPU適用于廣泛的市場，而汽車行業(yè)就是重要的一個(gè)。實(shí)際上，Imagination為汽車

2021-02-01 06:11:16

Xilinx收購Auviz Systems，F(xiàn)PGA與GPU之戰(zhàn)終于要開始了

、機(jī)器學(xué)習(xí)、視覺算法等，為行業(yè)提供基于FPGA的中間件IP，以減少應(yīng)用程序的功耗。FPGA可作為類似GPU一樣的加速技術(shù)被整合在處理器產(chǎn)品當(dāng)中，與傳統(tǒng)的芯片不同，F(xiàn)PGA芯片出廠后，客戶可根據(jù)不同場景

2016-09-08 13:54:13

ZigBee(2.4GHz頻段)與433MHz頻段無線通信技術(shù)的對比

。大家有這方面經(jīng)驗(yàn)的聊聊唄，現(xiàn)在自己在做ZigBee這塊，想順便熟悉下433MHz無線通信技術(shù)，挖掘挖掘優(yōu)點(diǎn)。

2018-05-14 02:53:20

ai芯片和gpu的區(qū)別

ai芯片和gpu的區(qū)別▌車載芯片的發(fā)展趨勢(CPU-GPU-FPGA-ASIC)過去汽車電子芯片以與傳感器一一對應(yīng)的電子控制單元(ECU)為主，主要分布與發(fā)動(dòng)機(jī)等核心部件上。...

2021-07-27 07:29:46

?GPU，RISC-V的長痛

AR350。在這樣的大佬帶領(lǐng)下，Think Silicon或許有機(jī)會(huì)更進(jìn)一步，把RISC-V GPU往光追這樣的先進(jìn)圖形技術(shù)上發(fā)展。開源GPU生態(tài)RISC-V作為一個(gè)開源指令集，自然也少不了開源

2022-03-24 15:53:12

【技術(shù)系列】淺談GPU虛擬化技術(shù)（第一章）

摘要： GPU深度好文系列，阿里云技術(shù)專家分享第一章GPU虛擬化發(fā)展史GPU的虛擬化發(fā)展歷程事實(shí)上與公有云市場和云計(jì)算應(yīng)用場景的普及息息相關(guān)。如果在10年前談起云計(jì)算，大部分人的反應(yīng)是“不知所云

2018-04-16 10:51:32

【直播預(yù)告】今晚7點(diǎn)，來HarmonyOS極客松直播間與技術(shù)專家聊聊新技術(shù)！

HarmonyOS極客松直播間與技術(shù)專家聊聊新技術(shù)！

2023-06-20 11:08:30

串行通信技術(shù)在DNC通信系統(tǒng)中有什么應(yīng)用？

DNC數(shù)據(jù)傳輸系統(tǒng)的結(jié)構(gòu)是有哪些部分組成的？串行通信技術(shù)在DNC通信系統(tǒng)中有什么應(yīng)用？

2021-05-28 07:08:13

什么是4G通信技術(shù)？

移動(dòng)通信技術(shù)已經(jīng)歷了三個(gè)主要發(fā)展階段。每一代的發(fā)展都是技術(shù)的突破和觀念的創(chuàng)新。第一代起源于20世紀(jì)80年代，主要采用模擬和頻分多址(FDMA)技術(shù)。第二代(2G)起源于90年代初期，主要采用

2019-08-23 07:59:02

華為的GPU Turbo技術(shù)你知道是什么嗎？

華為GPU Turbo揭秘，嚇人的技術(shù)，原來只是神經(jīng)網(wǎng)絡(luò)

2019-11-11 06:24:43

在Ubuntu上使用Nvidia GPU訓(xùn)練模型

問題最近在Ubuntu上使用Nvidia GPU訓(xùn)練模型的時(shí)候，沒有問題，過一會(huì)再訓(xùn)練出現(xiàn)非?？D，使用nvidia-smi查看發(fā)現(xiàn)，顯示GPU的風(fēng)扇和電源報(bào)錯(cuò)：解決方案自動(dòng)風(fēng)扇控制在nvidia

2022-01-03 08:24:09

在passthrough中使用GPU進(jìn)行測試

我在xenserver 6.2 SP1上的傳遞模式中有K2，我正在嘗試確定我的應(yīng)用程序如何強(qiáng)調(diào)GPU。我添加了nvidia WMI包，但是對于我關(guān)心的所有GPU值，例如內(nèi)存和％GPU，windows

2018-10-10 16:17:40

基于磁貼的GPU架構(gòu)優(yōu)缺點(diǎn)

本指南介紹了基于磁貼的GPU架構(gòu)的優(yōu)缺點(diǎn)。它還將ARM馬里基于瓷磚的GPU架構(gòu)設(shè)計(jì)與臺式PC或控制臺中常見的更傳統(tǒng)的即時(shí)模式GPU進(jìn)行了比較。馬里GPU使用基于平鋪的渲染體系結(jié)構(gòu)。這意味著GPU

2023-08-02 12:54:29

如何使用iMX8mmini提高GPU性能？

我正在使用 iMX8mmini 并嘗試提高 GPU 性能。使用下面的命令我發(fā)現(xiàn)當(dāng)前 GPU 以 500 MHz 的頻率運(yùn)行。根據(jù)數(shù)據(jù)表或設(shè)備樹節(jié)點(diǎn)，GPU 以 800 MHz 的標(biāo)稱頻率運(yùn)行（最大

2023-04-18 07:17:15

如何揭開 GPU 的神秘面紗？

GPU具體發(fā)揮著什么作用？關(guān)于GPU的可編程著色器應(yīng)用分析

2021-04-02 06:16:34

如何獲取GPU vivante這些文件和目錄？

我必須對 GPU vivante 進(jìn)行一些測試。我可以在文檔中看到它提到了 /unit_tests/GPU。 gpu.sh 和 gpu_info.sh 以及一些示例 /opt/viv_samples/vdk。你能幫幫我嗎，如何獲取這些文件和目錄？任何鏈接。

2023-05-22 06:27:51

手機(jī)GPU大全

高通（Qualcomm）不只是一家在移動(dòng)SoC芯片和3G通信技術(shù)上造詣?lì)H深的公司，而且是一家擁有移動(dòng)GPU自主設(shè)計(jì)能力和生產(chǎn)能力的公司。移動(dòng)GPU是SoC芯片的一部分，與ARM架構(gòu)的通用處理器（CPU）一起構(gòu)成SoC芯片體現(xiàn)應(yīng)用性能的兩個(gè)重要部分。·······

2011-08-09 10:52:23

招GPU兼職講師

企業(yè)培訓(xùn)公司面向單位員工培訓(xùn)，長期招GPU兼職老師，一般三天左右的短周期培訓(xùn)，周末為主，有2人左右的小輔導(dǎo)，也有30人左右的培訓(xùn)大班，待遇優(yōu)，北京，上海，成都，廣州，深圳等，如您想掙點(diǎn)外塊，積累資源

2017-10-26 10:58:11

樹莓派GPU使用教程

最近在準(zhǔn)備做個(gè)樹莓派GPU編程的項(xiàng)目，發(fā)現(xiàn)水還是很深的。不過還是有一些心得，準(zhǔn)備稍微整理一下，留作后來人的參考。先放一張圖：分別是CPU和GPU計(jì)算的效率對比具體內(nèi)容，元旦后整理作為一個(gè)系列，也作為自己的一個(gè)紀(jì)念。

2016-12-28 23:13:26

溫度對GPU頻率的影響是什么？

溫度對GPU頻率的影響是什么？

2022-03-10 07:47:45

自學(xué)通信技術(shù)必備哪些書籍？

自學(xué)通信技術(shù)必備哪些書籍？

2021-06-22 08:03:19

蜂窩移動(dòng)通信技術(shù)與無線局域網(wǎng)技術(shù)概述

1、蜂窩移動(dòng)通信技術(shù)和無線局域網(wǎng)技術(shù)的應(yīng)用場景趨于重合，增強(qiáng)移動(dòng)寬帶場景成為主要融合方向移動(dòng)互聯(lián)網(wǎng)和物聯(lián)網(wǎng)的迅猛發(fā)展驅(qū)動(dòng)數(shù)據(jù)流量的重心從有線向無線網(wǎng)絡(luò)加快轉(zhuǎn)移，促進(jìn)了無線市場的蓬勃發(fā)展。隨著4.5G

2019-06-19 06:12:06

誠聘GPU兼職講師

2017-10-26 10:56:09

請問CPU和GPU的關(guān)系是什么？

什么是顯卡？什么是GPU？什么是CUDA？CPU和GPU的關(guān)系是什么？

2021-09-27 08:22:16

談GPU的作用、原理及與CPU、DSP的區(qū)別

今天，GPU已經(jīng)不再局限于3D圖形處理了，GPU通用計(jì)算技術(shù)發(fā)展已經(jīng)引起業(yè)界不少的關(guān)注，事實(shí)也證明在浮點(diǎn)運(yùn)算、并行計(jì)算等部分計(jì)算方面，GPU可以提供數(shù)十倍乃至于上百倍于CPU的性能，如此強(qiáng)悍的“新星

2015-11-04 10:04:53

跳頻通信技術(shù)

我是通信專業(yè)學(xué)，最近對跳頻通信技術(shù)感興趣，有沒有大神推薦一些介紹跳頻通信技術(shù)的文獻(xiàn)給我啊。有沒有比較簡單的跳頻器設(shè)計(jì)方案呢？

2013-04-06 23:01:08

邁拓維矩對通信技術(shù)的影響

邁拓維矩對通信技術(shù)的影響

2017-04-22 14:41:27

高通產(chǎn)品的進(jìn)來聊聊

高通產(chǎn)品的進(jìn)來聊聊,共享一下資源.

2011-01-03 14:32:16

196.國產(chǎn)GPU刷新全球算力記錄

gpu

小凡發(fā)布于 2022-10-04 12:23:39

220.GPU相關(guān)視頻

gpu

小凡發(fā)布于 2022-10-04 13:04:48

223.GPU是怎么處理游戲畫面的？

gpu

小凡發(fā)布于 2022-10-04 13:08:08

245.手把手教你解決GPU配置報(bào)錯(cuò)問題

gpu

小凡發(fā)布于 2022-10-04 13:36:33

263.什么是GPU

gpu

小凡發(fā)布于 2022-10-04 14:14:08

266.電腦中CPU與GPU的區(qū)別

gpu

小凡發(fā)布于 2022-10-04 15:12:12

gpu_gpu是什么意思

本內(nèi)容介紹了gpu_gpu是什么意思，gpu的作用及gpu工作原理，GPU英文全稱Graphic Processing Unit，中文翻譯為圖形處理器。

2011-12-21 16:11:38

9629

Imagination回應(yīng)蘋果停用 GPU 事件：不采用我們的技術(shù)專利，很難！

市場傳播副總裁 David Harold對于之前傳言的蘋果將會(huì)在兩年后停用Imagination GPU一事作了再一次回應(yīng)?！拔覀冞€在協(xié)談中。Imagination的GPU技術(shù)有很多的專利技術(shù)，如果

2017-05-27 10:15:12

997

傳三星要自行研發(fā)GPU 自研GPU的好處是什么

記者調(diào)查可知，三星目前正在招募GPU的技術(shù)研發(fā)人才，計(jì)劃要自己研發(fā)GPU，三星強(qiáng)大的芯片研發(fā)實(shí)力證明自行研發(fā)GPU是完全沒問題的。但是有人不解自研GPU能夠給三星帶來什么樣的好處。

2017-12-28 14:24:33

1795

基于GPU加速的醫(yī)學(xué)圖像配準(zhǔn)技術(shù)

針對目前醫(yī)學(xué)圖像配準(zhǔn)技術(shù)無法滿足臨床實(shí)時(shí)性需求問題，對基于圖形處理器（ GPU）加速的醫(yī)學(xué)圖像配準(zhǔn)技術(shù)進(jìn)行綜述探討。首先對GPU通用計(jì)算進(jìn)行概述，再以醫(yī)學(xué)圖像配準(zhǔn)基本框架為主線，對近年來基于GPU

2018-01-03 11:08:49

2018年臺灣GPU技術(shù)大會(huì)：美超微展示GPU服務(wù)器平臺選擇

) (NASDAQ: SMCI)今天宣布，該公司在2018年臺灣GPU技術(shù)大會(huì)(GPU Technology Conference (GTC) Taiwan 2018)的白金贊助商展位上，展示業(yè)內(nèi)最為廣泛的GPU

2018-06-01 10:57:00

2651

NVIDIA虛擬GPU技術(shù)：用戶將享受來自“云端”的極致體驗(yàn)

NVIDIA虛擬GPU業(yè)務(wù)副總裁John Fanelli近期接受采訪時(shí)介紹NVIDIA的虛擬GPU技術(shù)。

2018-07-09 15:44:23

2618

榮耀Note 10宣傳海報(bào)發(fā)布，或搭載了GPU Turbo技術(shù)

榮耀手機(jī)官方微博放出了榮耀Note 10的宣傳海報(bào),雙渦輪發(fā)動(dòng)機(jī)暗示榮耀Note 10搭載了GPU Turbo技術(shù)。 GPU Turbo是一種類似汽車上的渦輪增壓技術(shù),能夠提高手機(jī)GPU的性能,圖形

2018-07-30 17:41:26

733

深度解析華為“很嚇人的技術(shù)”：GPU Turbo

華為GPU Turbo這一項(xiàng)技術(shù)首先是在6月6日的榮耀Play上搭載，在發(fā)布前也余承東對自家GPU Turbo技術(shù)的宣傳語就是”一項(xiàng)很嚇人的技術(shù)”。

2018-09-10 16:42:28

14841

聊聊關(guān)于架構(gòu)的話題

　技術(shù)需要架構(gòu)，芯片的架構(gòu)，軟件需要架構(gòu)，公司需要架構(gòu)，建筑需要架構(gòu)，產(chǎn)品需要架構(gòu)，人也需要架構(gòu)，聊聊架構(gòu)的話題。

2019-09-28 02:48:00

2047

5種GPU虛擬化技術(shù)的詳細(xì)資料講解

GPU，也即圖形處理單元。不論在手機(jī)中，還是在電腦、筆記本上，GPU都發(fā)揮著不可替代的作用。往期文章中，小編對GPU加速原理、GPU服務(wù)器選擇、GPU存儲性能提升等均有所介紹。為增進(jìn)大家對GPU的認(rèn)識，本文將對GPU的5種虛擬化技術(shù)的實(shí)現(xiàn)策略予以介紹。如果你對GPU具有興趣，不妨繼續(xù)往下閱讀哦。

2021-02-08 17:48:00

9237

熱虹吸散熱技術(shù)解決GPU服務(wù)器散熱問題

隨著深度學(xué)習(xí)、仿真、BIM設(shè)計(jì)、AEC行業(yè)在各行各業(yè)應(yīng)用的發(fā)展，在AI技術(shù)虛擬GPU技術(shù)的加持之下，需要強(qiáng)大的GPU算力解析。無論是GPU服務(wù)器，還是GPU工作站都趨向于小型化、模塊化、高集成度

2021-10-09 14:11:38

1578

一文詳細(xì)了解相干光通信技術(shù)

今天這篇文章，我們來聊聊一個(gè)“網(wǎng)紅”技術(shù)——相干光通信。

2022-04-14 09:15:43

5615

GPU是什么 GPU常見計(jì)算精度

GPU是協(xié)處理器，與CPU端存儲是分離的，故GPU運(yùn)算時(shí)必須先將CPU端的代碼和數(shù)據(jù)傳輸?shù)?b class="flag-6" style="color: red">GPU，GPU才能執(zhí)行kernel函數(shù)。涉及CPU 與GPU通信，其中通信接口PCI-E的版本和性能會(huì)直接影響通信帶寬。

2022-11-29 14:48:25

4490