NVIDIA ADAS-英偉達硬件芯片Orin解析

上篇文章NVIDIA ADAS-英偉達DriveOS入門，介紹了英偉達的軟件，本篇文章來說明下現(xiàn)在英偉達在智能駕駛上已商用最新的硬件芯片Orin。

目前Orin訂單火爆，上汽的R和智己，理想L9、蔚來ET7、小鵬新一代P7，威馬M7、比亞迪、沃爾沃XC90，還有自動駕駛卡車公司智加科技，Robotaxi等眾多明星企業(yè)Cruise、Zoox、滴滴、小馬智行、AutoX、軟件公司Momonta等等，都搭載Orin平臺進行開發(fā)，看陣容就不可小覷，可謂地表最強算力芯片。

1. 英偉達智駕SoC芯片發(fā)展史

從2015年開始，英偉達開始進入車載SoC和車載計算平臺領(lǐng)域，為自動駕駛提供基礎(chǔ)計算能力。此后英偉達幾乎每隔兩年發(fā)布一款車規(guī)級SoC芯片，且不斷拉升算力水平。2020年，Xavier芯片算力為30 TOPS，2022年發(fā)布的Orin算力為254 TOPS，2022秋季GTC大會上發(fā)布了新自動駕駛芯片Thor，算力為2000TFLOPS@FP8、4000TOPS@INT8，取代了之前發(fā)布的算力達1000TOPS的Altan。

也就是說目前商用最新的芯片就是Orin。英偉達使用的車企陣容強大，如下圖：

1.1 Xavier平臺

NVIDIA在2018年CES上推出了Xavier平臺，作為Driver PX2 的進化版本。NVIDIA稱Xavier 是“世界上最強大的SoC（片上系統(tǒng)）”，Xavier可處理來自車輛雷達、攝像頭、激光雷達和超聲波等傳感器的自主駕駛感知數(shù)據(jù)，能效比市場上同類產(chǎn)品更高，體積更小。“NVIDIA Jetson AGX Xavier 為邊緣設(shè)備的計算密度、能效和 AI 推理能力樹立了新的標桿?！?/p>

2020年4月上市的小鵬汽車P7，成為首款搭載 NVIDIA DRIVE AGX Xavier 自動駕駛平臺的量產(chǎn)車型，小鵬 P7 配備了13 個攝像頭、5 個毫米波雷達、12 個超聲波雷達，集成開放式的 NVIDIA DRIVE OS 操作系統(tǒng)。

Xavier SoC基于臺積電12nm FinFET工藝，集成90億顆晶體管，芯片面積350平方毫米，CPU采用NVIDIA自研8核ARM64架構(gòu)（代號Carmel），集成了Volta架構(gòu)的GPU（512個CUDA核心），支持FP32/FP16/INT8，20W功耗下單精度浮點性能1.3TFLOPS，Tensor核心性能20TOPs，解鎖到30W后可達30TOPs。

Xavier是一顆高度異構(gòu)的SoC處理器，集成多達八種不同的處理器核心或者硬件加速單元。使得它能同時、且實時地處理數(shù)十種算法，以用于傳感器處理、測距、定位和繪圖、視覺和感知以及路徑規(guī)劃等任務(wù)負載。

除了強大的計算資源外，Xavier SoC擁有豐富的IO接口資源：

Xavier的主處理器可以達到ASIL-B級別的功能安全等級需求。Ecotron公司基于NVIDIA Xavier SoC和Infineon TC297 MCU打造、面向L3/L4級別自動駕駛領(lǐng)域的高性能中央計算平臺。按照設(shè)計方案考慮，Xavier智能處理器用于環(huán)境感知、圖像融合、路徑規(guī)劃等，TC297 MCU用于滿足ISO26262功能安全需求（ASIL-C/D級別）的控制應用場景（也即作為Safety Core）?，比如安全監(jiān)控、冗余控制、網(wǎng)關(guān)通訊及整車控制。

雙Xavier+TC297 MCU的方案結(jié)構(gòu)圖：

此用法雖然是舊平臺的，但是其方案之后也是一直繼承的，即TCXXX的車控芯片獨立運行AUTOSAR，這里畫出了兩個域：智駕域（NVIDIA）+車控域（TC），座艙一般直接使用成熟便宜的手機安卓技術(shù)了。就看未來是否有中央式架構(gòu)實現(xiàn)的可能了，目前還是三域架構(gòu)。

1.2 Orin平臺

2019年12月英偉達發(fā)布了新一代面向自動駕駛和機器人領(lǐng)域Orin芯片和計算平臺。具有ARM Hercules CPU內(nèi)核和英偉達下一代GPU架構(gòu)。Orin SoC包含170億晶體管，晶體管的數(shù)量幾乎是Xavier SoC的兩倍，具有12個ARM Hercules內(nèi)核，將集成Nvidia下一代Ampere架構(gòu)的GPU，提供200 TOPS@INT8性能，接近Xavier SoC的7倍，Orin SOC將在2021年提供樣片，2022年正式面向車廠量產(chǎn)。

2020年5月GTC上，英偉達介紹了即將發(fā)布的新一代自動駕駛Drive AGX Orin平臺，它可以搭載兩個Orin SoC和兩塊NVIDIA Ampere GPU，可以實現(xiàn)從入門級ADAS解決方案到L5級自動駕駛出租車（Robotaxi）系統(tǒng)的全方位性能提升，平臺最高可提供2000TOPS算力。未來L4/L5級別的自動駕駛系統(tǒng)將需要更復雜、更強大的自動駕駛軟件框架和算法，借助強勁的計算性能，Orin計算平臺將有助于并發(fā)運行多個自動駕駛應用和深度神經(jīng)網(wǎng)絡(luò)模型算法。

作為一顆專為自動駕駛而設(shè)計的車載智能計算平臺，Orin可以達到ISO 26262 ASIL-D 等級的功能安全標準。

借助于先進的7nm制程工藝，Orin擁有非常出色的功耗水平。在擁有200TOPS的巨大算力時，TDP僅為50W。NVIDIA Orin處理器功能模塊圖

下表是Jetson AGX Orin的片上系統(tǒng)的性能參數(shù)：

image.png

1.3 Thor平臺

NVIDIA DRIVE Thor 是NVIDIA新一代集中式車載計算平臺，可在單個安全、可靠的系統(tǒng)上運行高級駕駛員輔助應用和車載信息娛樂應用。DRIVE Thor 超級芯片借助我們新的 CPU 和 GPU 突破，可提供出色的 2000 萬億次浮點運算性能，同時降低總體系統(tǒng)成本，計劃于2025年開始量產(chǎn)。

可以看到三域開始變兩域了，智駕和座艙統(tǒng)一了，一統(tǒng)天下看來指日可待了，就需要利用安全技術(shù)解決最后一個車控MCU就可以了。

DRIVE Thor 還在深度神經(jīng)網(wǎng)絡(luò)準確性方面實現(xiàn)了令人難以置信的飛躍。Transformer 引擎是NVIDIA GPU Tensor Core的新組件。Transformer 網(wǎng)絡(luò)將視頻數(shù)據(jù)作為單個感知幀進行處理，使計算平臺能夠隨著時間的推移處理更多數(shù)據(jù)。

該SoC能夠進行多域計算，這意味著它可以劃分自動駕駛和車載信息娛樂的任務(wù)。這種多計算域隔離可以讓并發(fā)的時間關(guān)鍵進程不間斷地運行。在一臺計算機上，車輛可以同時運行Linux、QNX和Android。通常，這些類型的功能由分布在車輛各處的數(shù)十個電子控制單元控制。制造商現(xiàn)在可以利用 DRIVE Thor 隔離特定任務(wù)的能力來整合車輛功能，而不是依賴這些分布式ECU。

所有車輛顯示器、傳感器等都可以連接到這個單一SoC，從而簡化了汽車制造商極其復雜的供應鏈。

參考：https://blogs.nvidia.com/blog/drive-thor/

2. Orin架構(gòu)介紹

以 Orin-x 為例，其中的 CPU 包括基于 Arm Cortex-A78AE 的主CPU 復合體，它提供通用高速計算能力；以及基于 Arm Cortex-R52 的功能安全島（FSI），它提供了隔離的片上計算資源，減少了對外部 ASIL D 功能安全 CPU 處理的需求。

GPU 則是 NVIDIAAmpere GPU，為 CUDA 語言提供高級并行處理計算能力，并支持多種工具，如 TensorRT，一種深度學習推理優(yōu)化器和運行時，可提供低延遲和高吞吐量。Ampere 還提供最先進的圖形功能，包括實時光線跟蹤。域特定硬件加速器（DSA）是一組專用硬件引擎，旨在從計算引擎中卸載各種計算任務(wù)，并以高吞吐量和高能效執(zhí)行這些任務(wù)。

整個芯片內(nèi)部架構(gòu)設(shè)計主要是按分塊進行功能設(shè)計區(qū)分。包括操作系統(tǒng)底層軟件QNX BSP（時鐘Clock源&系統(tǒng)重啟、CAN/SPI/I2C/GPIO/UART 控制器、配置寄存器、系統(tǒng)配置）、實時運行系統(tǒng)QNX RTOS、Nv多媒體處理模塊（傳感器處理模塊MCU（R5）、PVA、DLA、Audio Processor、MCU R5配置實時相機輸入）、經(jīng)典Autosar處理模塊（用于Safety Island Lock-Step R52s）、安全服務(wù)Safety Service（ARM Cotex-A78AE CPU Complex、CPU Switch fabric Coherent、信息安全PSC）、神經(jīng)網(wǎng)絡(luò)處理模塊（CUDA & TensorRT）。

下圖顯示了 SoC 的高級架構(gòu)，分為三個主要處理復合體：CPU、GPU 和硬件加速器。

2.1 CPU相關(guān)

Orin系統(tǒng)架構(gòu)中，CPU從之前自研的Carmel架構(gòu)回到了到5納米工藝的ARM Cortex-A78上。Orin-x中CPU包括 12個 Cortex-A78，可以提供通用的目標高速計算兼容性。同時，Arm Cortex R52 基于功能安全設(shè)計（FSI），可以提供獨立的片上計算資源，這樣就可以不用增加額外的 CPU（ASIL D）芯片用來提供功能安全等級。

CPU 族群所支持的特性包括 Debug 調(diào)試，電源管理，Arm CoreLink 中斷控制器，錯誤檢測與報告。CPU需要對芯片進行整體性能監(jiān)控，每個核中的性能監(jiān)控單元提供了六個計算單元，每個單元可以計算處理器中的任何事件?；?PMUv3 架構(gòu)上，在每個 Runtime 期間這些計算單元會收集不同的統(tǒng)計值并運行在處理器和存儲系統(tǒng)上。

2.2 GPU

Orin采用了新一代的Ampere架構(gòu)GPU，由2個GPC（Graphics Processing Clusters，圖形處理簇）組成。每個GPC又包含4個TPC（Texture Processing Clusters，紋理處理簇），每個TPC由2個SM（Streaming Multiprocesor，流處理器）組成，下圖為Orin的GPU架構(gòu)。每個SM有192KB的L1緩存和4MB的L2緩存，包含128個CUDA Core和4個Tensor Core。因此Orin總計2048個CUDA Core和64個Tensor Core，INT8稀疏算力為170 TOPS（Tensor Core提供），INT8稠密算力為54TOPS，F(xiàn)P32算力為5.3TFLOP（由Cuda Core提供）。

NVIDIA Ampere GPU 可以提供先進的并行處理計算架構(gòu)。開發(fā)者可以使用 CUDA 語言進行開發(fā)（后續(xù)將對CUDA架構(gòu)進行詳細說明），并支持 NVIDIA 中各種不同的工具鏈（如開發(fā) Tensor Core 和 RT Core 的應用程序接口）。一個深度學習接口優(yōu)化器和實時運行系統(tǒng)可以傳遞低延遲和高效輸出。Ampere GPU 同時可以提供如下一些的特性來實現(xiàn)對高分辨率、高復雜度的圖像處理能力（如實時光流追蹤）。

稀疏化：：細粒度結(jié)構(gòu)化稀疏性使吞吐量翻倍，減少對內(nèi)存消耗。浮點處理能力：每個時鐘周期內(nèi)可實現(xiàn) 2 倍 CUDA 浮點性能。

緩存：：流處理器架構(gòu)可以增加 L1 高速緩存帶寬和共享內(nèi)存，減少緩存未命中延遲。提升異步計算能力，后 L2 緩存壓縮。

2.3 加速器

特定域硬件加速器（DSAs、DLA、PVA）是一組特殊目的硬件引擎，實現(xiàn)計算引擎多任務(wù)、高效、低功率等特性。計算機視覺和深度學習簇包括兩個主要的引擎：可編程視覺加速器 PVA 和深度學習加速器 DLA（而在最新的中級算力 Orin n 芯片則取消了 DLA 處理器）。

PVA 是第二代 NVIDIA 視覺DSP架構(gòu)，它是一種特殊應用指令矢量處理器，這種處理器是專門針對計算機視覺、ADAS、ADS、虛擬現(xiàn)實系統(tǒng)。PVA 有一些關(guān)鍵的要素可以很好的適配預測算法領(lǐng)域，且功耗和延遲性都很低。Orin-x需要通過內(nèi)部的R核（Cortex-R5）子系統(tǒng)可以用于 PVA 控制和任務(wù)監(jiān)控。一個 PVA 簇可以完成如下任務(wù)：雙向量處理單元（VPU）帶有向量核，指令緩存和 3 矢量數(shù)據(jù)存儲單元。每個單元有 7 個可見的插槽，包含可標量和向量指令。此外，每個 VPU 還含有 384 KBytes的3端口存儲容量。

DLA 是一個固定的函數(shù)引擎，可用于加速卷積神經(jīng)網(wǎng)絡(luò)中的推理操作。Orin-x 單獨設(shè)置了 DLA 用于實現(xiàn)第二代 NVIDIA 的 DLA架構(gòu)。DLA支持加速 CNN 層的卷積、去卷積、激活、池化、局部歸一化、全連接層。最終支持優(yōu)化結(jié)構(gòu)化稀疏、深度卷積、一個專用的硬件調(diào)度器，以最大限度地提高效率。

2.4 第二代視覺加速器PVA和VIC

Orin中對PVA進行了升級，包括雙7路VLIW（超長指令字）矢量處理單元、雙DMA和Cortex-R5，支持計算機視覺中過濾、變形、圖像金字塔、特征檢測和FFT等功能。

Orin還包含一個Gen 4.2視頻成像合成器 (Video Imaging Compositor，VIC) 2D 引擎，支持鏡頭畸變校正和增強、時間降噪、視頻清晰度增強、像素處理（色彩空間轉(zhuǎn)換、縮放、混合和合成）等圖像處理功能。

為了調(diào)用Orin SoC上的多個硬件組件（PVA、VIC、CPU、GPU、 ENC等），英偉達開發(fā)了視覺編程接口?( Vision Programming Interface，VPI)?。作為一個軟件庫，VPI附帶了多種圖像處理算法（如框過濾、卷積、圖像重縮放和重映射）和計算機視覺算法（如哈里斯角檢測、KLT 特征跟蹤器、光流、背景減法等）。

2.5 內(nèi)存和通訊

image.png

上圖顯示了Orin各組件中，通過內(nèi)存控制器結(jié)構(gòu)（Fabric）和DRAM如何通訊和數(shù)據(jù)交互。

Orin最高支持64GB的256位LPDDR5和64GB的eMMC。DRAM支持3200MHz的最大時鐘速度，每個引腳6400Gbps，支持204.8GB/s的內(nèi)存帶寬，是Xavier內(nèi)存帶寬 memory bandwidth 的1.4倍、存儲storage的2倍。

3. 基于Orin的自動駕駛平臺架構(gòu)設(shè)計

常規(guī)的 SOC 系統(tǒng)架構(gòu)通常是包含有常規(guī)的 SOC+MCU 雙芯片甚至三芯片的方式進行設(shè)計的。SOC 由于計算性能上的優(yōu)勢，一般在前端感知、規(guī)劃中的計算應用場景比 MCU 更好。

MCU 由于具備較高的功能安全等級，可以作為控制執(zhí)行的校驗輸出。業(yè)界對于英偉達芯片是否可以單純作為類似 TDA4 一樣的超異構(gòu)芯片而獨立承擔任務(wù)，一直都是褒貶不一的。原則上，從無論 Xavier 還是 Orin 系列，英偉達系列芯片設(shè)計都兼具豐富的 AI 和 CPU 算力能力?？紤] L2+級別以上的自動駕駛系統(tǒng)開發(fā)而言，這種能力都是可以完全適配整個方案設(shè)計的?？赡苁菍τ诎踩筝^高的車控MCU不光是技術(shù)上先進就可以替代，主要還是裝機量，需要用起來安全才可以。

3.1 安全考慮

可以看到基本R52核實現(xiàn)的安全島達到了ASIL-D，其他基本還是只滿足ISO 26262。所以需要一個SMCU作為輔助實現(xiàn)車控域。如英飛凌 Aurix TC系列，瑞薩的 RH850 系列都可以充當 MCU 實現(xiàn)對 Orin 的 SMCU 接入。這樣的 SMCU 實際是可以充當整個系統(tǒng)開發(fā)的電源控制和嚴重失效故障規(guī)避的。在英偉達賣的開發(fā)平臺上就可以看到SMCU TC397的身影，如下圖：

通過可信安全加載技術(shù)，ATF中BL1存入ROM，里面有BL2的安全校驗，然后形成鏈式安全加載。包括 u-boot 在內(nèi)的所有低級引導步驟都可以通過簽名的二進制文件來確保安全。它們的密鑰可以存儲在 CPU 中的一次性可編程保險絲中。U-boot 本身可以配置為使用簽名的FIT 映像，從而提供一個安全的引導鏈，一直到 Linux 內(nèi)核。初始 ROM 引導加載程序和 TegraBoot 也都支持完全冗余的引導路徑。

3.2 FSI介紹

上圖顯示了如何在英偉達系列芯片中加載 FSI 及底層相關(guān)模塊驅(qū)動引導程序。英偉達系列芯片在功能安全設(shè)計上，Orin 系列通過制定目標實現(xiàn) ASIL D 系統(tǒng)能力設(shè)計和ASIL B/D 隨機錯誤管理能力設(shè)計。包括基于 SOC 芯片硬件的 ASIL 分解需求到各個核，確保核間設(shè)計一致性可以滿足 ASIL D 需求，并應用標準的 ASIL D 開發(fā)流程到整個功能安全設(shè)計中，從底之上分別對安全流程、Drive AGX、操作系統(tǒng) Drive OS、Drive Work、傳感器、冗余架構(gòu)設(shè)計、安全策略幾個方面分別進行相應的安全設(shè)計。

英偉達系列芯片的功能安全島（FSI）是一個包含 Cortex-R52 和 Cortex-R5F real 的處理器集群，并具有專用 I/O 控制器的時間處理器的核心。例如，Orin-X 中的 FSI 模塊具有自己的電壓軌、振蕩器和PLL、SRAM，以確保與 SOC 內(nèi)部的其他模塊相互作用最小，并實現(xiàn)如上模塊相互之間無干擾。

Cortex-R52 處理器，也稱為安全CPU，具有 DCLS（雙核鎖步）模式下的 4 個內(nèi)核（共 8 個物理內(nèi)核），可運行經(jīng)典 AUTOSAR 操作系統(tǒng)，實現(xiàn)錯誤處理、系統(tǒng)故障處理和其他客戶工作負載，綜合性能約為 10KDMIPs。

Cortex-R5F 處理器，也稱為加密硬件安全模塊（CHSM），用于通過 CAN 接口運行加密和安全用例，如安全車載通信（SecOC）。

整個FSI機制上總體包含有如下的一些安全指令和控制接口信息：

1、安全和 CHSM CPU 每個核心的緊密耦合內(nèi)存、指令和數(shù)據(jù)緩存。

2、安全島上總共有 5MB 的片上專用 RAM，以確保代碼執(zhí)行和數(shù)據(jù)存儲可以保持在 FSI 內(nèi)。

3、島上有專門用于與外部組件通信的專用 I/O 接口。包含1個 UART，4 個 GPIO 口。

4、硬件安全機制，如 FSI 內(nèi)所有 IP 的 DLS、CRC、ECC、奇偶校驗、超時等。專用熱、電壓和頻率監(jiān)測器。

5、邏輯隔離，確保與 SoC 的其他部分有足夠的錯誤恢復時間FFI。

3.3 TESC

Tegra是英偉達芯片中特有的信息安全芯片內(nèi)核，Tegra Security Controller(TESC)是一種信息安全子系統(tǒng)，他有自己的可信任根ROM、IMEM、DMEM，Crypto 加速器（AES、SHA、RNG、PKA），關(guān)鍵鏈路和關(guān)鍵存儲。TSEC 提供了一個片上TEE（可信任執(zhí)行環(huán)境）可以運行NVIDIA-標記的為處理代碼。TSEC是一種典型的安全視頻回放解決方案，下載信息安全運行所需的HDCP1.x 和2.x連接授權(quán)和完整的線端連接檢測。

1）線端HDMI 1.4上的HDCP 1.4和線端HDMI 2.3上的HDCP 2.0 2.1；?HDCP連接管理沒有暴露受保護的內(nèi)容，也無需運行在CPU上的軟件鑰匙。用于 HDCP 鏈路管理的兩個軟件可編程獨立指令隊列（最多可容納 16 條指令）；整個芯片能夠獨立于播放器在 HDCP 狀態(tài)檢查失敗時禁用 HDMI 輸出。

2）平臺安全控制器；?他是一個高安全子系統(tǒng)，他可以保護和管理SOC中的資產(chǎn)（鑰匙、保險絲、功能、特性），并提供可信任的服務(wù)，提升自由的抵御對 SOC 的攻擊，并可以提高對子系統(tǒng)本身的軟件和硬件攻擊的保護水平。

3）鑰匙管理和保護；?PSC 將是唯一可以訪問芯片中最關(guān)鍵秘鑰的機制。該子系統(tǒng)代表了 Orin-x 中最高級別的保護，并且該子系統(tǒng)本身對各種軟件和硬件攻擊具有高度的彈性。

4）授信服務(wù)；?例如，在 SOC 安全啟動期間，主要的 PSC 服務(wù)可以完成有效的安全身份驗證、提供額外的密鑰/ID/數(shù)據(jù)、密鑰訪問和管理、隨機數(shù)生成和授信的時間報告。

5）信息安全監(jiān)控。?PSC 將負責定期的安全管理任務(wù)，包括持續(xù)評估 SOC 的安全狀態(tài)，主動監(jiān)控已知或潛在的攻擊模式（例如，電壓故障或熱攻擊），降低硬件攻擊風險，并在檢測到有攻擊的情況下采取有效的措施。PSC 將能夠接受各種軟件更新來作為解決方法，以提高現(xiàn)場系統(tǒng)的穩(wěn)健性。

3.4 安全引擎（SE）

安全引擎SE中有兩種情況針對軟件使用是有用的。其一，TZ-SE只能被可信任區(qū)域軟件所訪問。其二，NS/TZ-SE可配置用來被可信任的軟件區(qū)域或非安全軟件所訪問。安全引擎SE可以為各種加密算法提供硬件加速以及硬件支撐密鑰保護。SE提供的加密算法可以被軟件用來建立加密協(xié)議和安全特性。所有加密運算都是基于國際標準技術(shù)協(xié)會NIST批準的加密算法。

英偉達的安全引擎SE可支持包含如下的所有信息安全保障能力：

NIST合規(guī)的對稱以及非對稱加密和哈希算法、側(cè)信道對策（AES/RSA/ECC）、獨立并行信道、硬件鑰匙訪問控制（KAC）（基于規(guī)則，增強硬件訪問控制的對稱鑰匙）、16xAES，4xRSA/ECC鑰匙孔、硬件密鑰隔離（僅針對AES鑰匙孔）、讀保護（僅針對AES鑰匙孔）、硬件鑰匙孔函數(shù)、密鑰包裝/解包功能（AES->AES鑰匙孔）、鑰匙從鑰匙孔分離（KDF->AES鑰匙孔）、隨機鑰匙生成（RNG->AES鑰匙孔）。

4. GPU編程CUDA

image.png

上圖表示了 CUDA 架構(gòu)示意圖，表示了CPU，GPU，應用程序，CUDA 開發(fā)庫，運行環(huán)境，驅(qū)動之間的關(guān)系

4.1 GPU軟件架構(gòu)

自動駕駛領(lǐng)域使用的 AI 算法多為并行結(jié)構(gòu)。AI 領(lǐng)域中用于圖像識別的深度學習、用于決策和推理的機器學習以及超級計算都需要大規(guī)模的并行計算，更適合采用 GPU 架構(gòu)。由于神經(jīng)網(wǎng)絡(luò)的分層級數(shù)（通常隱藏層的數(shù)量越多，神經(jīng)網(wǎng)絡(luò)模擬的結(jié)果越精確）會很大程度的影響其在預測結(jié)果。擅長并行處理的 GPU 可以很好的對神經(jīng)網(wǎng)絡(luò)算法進行處理和優(yōu)化。因為，神經(jīng)網(wǎng)絡(luò)中的每個計算都是獨立于其他計算的，這意味著任何計算都不依賴于任何其他計算的結(jié)果，所有這些獨立的計算都可以在 GPU 上并行進行。通常 GPU 上進行的單個卷積計算要比 CPU 慢，但是對于整個任務(wù)來說，CPU 幾乎是串行處理方式，需要要逐個依次完成，因此，其速度要大大慢于 GPU。因此，卷積運算可以通過使用并行編程方法和GPU來加速。

英偉達通過 CPU+GPU+DPU 形成產(chǎn)品矩陣，全面發(fā)力數(shù)據(jù)中心市場。利用 GPU 在AI 領(lǐng)域的先天優(yōu)勢，英偉達借此切入數(shù)據(jù)中心市場。針對芯片內(nèi)部帶寬以及系統(tǒng)級互聯(lián)等諸多問題，英偉達推出了 Bluefield DPU 和 Grace CPU，提升了整體硬件性能。

對于英偉達的GPU而言，一個 GPC 中有一個光柵引擎（ROP）和 4 個紋理處理集群（TPC），每個引擎可以訪問所有的存儲。

4.2 CUDA編程

CUDA（Compute Unified Device Architecture，統(tǒng)一計算架構(gòu)） 作為連接 AI 的中心節(jié)點，CUDA+GPU 系統(tǒng)極大推動了 AI 領(lǐng)域的發(fā)展。搭載英偉達 GPU 硬件的工作站（Workstation）、服務(wù)器（Server）和云（Cloud）通過 CUDA軟件系統(tǒng)以及開發(fā)的 CUDA-XAI 庫，為自動駕駛系統(tǒng) AI 計算所需要的機器學習、深度學習的訓練（Train）和推理（Inference）提供了對應的軟件工具鏈，來服務(wù)眾多的框架、云服務(wù)等等，是整個英偉達系列芯片軟件開發(fā)中必不可少的一環(huán)。

CUDA 是一個基于英偉達 GPU 平臺上面定制的特殊計算體系/算法，一般只能在英偉達的 GPU 系統(tǒng)上使用。這里從開發(fā)者角度我們講講在英偉達 Orin 系列芯片中如何在 CUDA架構(gòu)上進行不同軟件級別開發(fā)。

從CUDA 體系結(jié)構(gòu)的組成來說，它包含了三個部分：開發(fā)庫、運行期環(huán)境和驅(qū)動。

“Developer Lib 開發(fā)庫”?是基于 CUDA 技術(shù)所提供的應用開發(fā)庫。例如高度優(yōu)化的通用數(shù)學庫，即cuBLAS、cuSolver 和 cuFFT。核心庫，例如 Thrust 和 libcu++；通信庫，例如 NCCL 和 NVSHMEM，以及其他可以在其上構(gòu)建應用程序的包和框架。

“Runtime 運行期環(huán)境”?提供了應用開發(fā)接口和運行期組件，包括基本數(shù)據(jù)類型的定義和各類計算、類型轉(zhuǎn)換、內(nèi)存管理、設(shè)備訪問和執(zhí)行調(diào)度等函數(shù)。

“Driver 驅(qū)動部分”?是 CUDA使能GPU的設(shè)備抽象層，提供硬件設(shè)備的抽象訪問接口。CUDA 提供運行期環(huán)境也是通過這一層來實現(xiàn)各種功能的。

在 CUDA 架構(gòu)下，一個程序分為兩個部份：host端和 device端。Host端是指在 CPU 上執(zhí)行的部份，而 device端則是在顯示芯片（GPU）上執(zhí)行的部份。Device 端的程序又稱為 "kernel"。通常 host 端程序會將數(shù)據(jù)準備好后，復制到顯卡的內(nèi)存中，再由顯示芯片執(zhí)行 device 端程序，完成后再由 host 端程序?qū)⒔Y(jié)果從顯卡的內(nèi)存中取回。這里需要注意的是，由于 CPU 存取顯存時只能透過 PCI Express 接口，因此速度較慢（PCI Express x16 的理論帶寬是雙向各 4GB/s），因此不能經(jīng)常進行，以免降低效率。

基于以上分析可知，針對大量并行化問題，采用 CUDA 來進行問題處理，可以有效隱藏內(nèi)存的延遲性 latency，且可以有效利用顯示芯片上的大量執(zhí)行單元，同時處理上千個線程 thread 。因此，如果不能處理大量并行化的問題，使用 CUDA 就沒辦法達到最好的效率了。

對于這一應用瓶頸來說，英偉達也在數(shù)據(jù)存取上做出了較大的努力提升。一方面，優(yōu)化的CUDA 改進了 DRAM 的讀寫靈活性，使得GPU與CPU的機制相吻合。另一方面，CUDA提供了片上（on-chip）共享內(nèi)存，使得線程之間可以共享數(shù)據(jù)。應用程序可以利用共享內(nèi)存來減少 DRAM 的數(shù)據(jù)傳送，更少的依賴 DRAM 的內(nèi)存帶寬。

此外，CUDA 還可以在程序開始時將數(shù)據(jù)復制進 GPU 顯存，然后在 GPU 內(nèi)進行計算，直到獲得需要的數(shù)據(jù)，再將其復制到系統(tǒng)內(nèi)存中。為了讓研發(fā)人員方便使用 GPU 的算力，英偉達不斷優(yōu)化 CUDA 的開發(fā)庫及驅(qū)動系統(tǒng)。操作系統(tǒng)的多任務(wù)機制可以同時管理 CUDA 訪問 GPU 和圖形程序的運行庫，其計算特性支持利用 CUDA 直觀地編寫 GPU 核心程序。

后記：

對于軟件開發(fā)人員學習SoC架構(gòu)也是非常有用的，在制定軟件方案的時候需要參考硬件上有那些通路，性能是否可以滿足，有那些硬件可以利用來支撐功能實現(xiàn)。在驅(qū)動開發(fā)的時候，需要羅列那些硬件模塊的需求需要開發(fā)，驅(qū)動對上層提供的服務(wù)要達到什么程度形成封裝API接口。

本篇文章為了更加全面準確的介紹Orin，除了參考官網(wǎng)的資料外，參考了大量他人的文章，見參考資料章節(jié)，對于芯片更細節(jié)的東西需要注冊英偉達官網(wǎng)賬號，甚至購買后有芯片的data sheet和FAE支持，這里不涉及。芯片研發(fā)和使用需要大量人力物力，這里雖只是冰山一角都這么多，也寫的比較流水賬，大家多多擔待。

審核編輯：黃飛

閱讀全文

NVIDIA(101461) NVIDIA(101461)
SoC芯片(34433) SoC芯片(34433)
adas(207768) adas(207768)
智能駕駛(48165) 智能駕駛(48165)
英偉達(87436) 英偉達(87436)

NVIDIA發(fā)布先進的軟件定義自主機器平臺DRIVE AGX Orin

NVIDIA于今日發(fā)布用于自動駕駛和機器人的高度先進的軟件定義平臺NVIDIA DRIVE AGX Orin。該平臺內(nèi)置全新Orin系統(tǒng)級芯片。該芯片由170億個晶體管組成，凝聚著NVIDIA團隊

2019-12-18 13:56:57

3433

全球三十多家NVIDIA技術(shù)合作伙伴于Computex發(fā)布首批Jetson AGX Orin生產(chǎn)系統(tǒng)

本周，全球30多家領(lǐng)先的技術(shù)合作伙伴在Computex上發(fā)布了首批基于NVIDIA Jetson AGX Orin的生產(chǎn)系統(tǒng)。

2022-05-24 12:01:00

2411

英偉達推出Jetson Orin Nano模組最高40TOPS性能，為機器人和邊緣AI提供強動力

（文/程文智）2022年9月20日，英偉達（NVIDIA）宣布推出全新的Jetson Orin Nano模組，進一步擴充了NVIDIA Jetson產(chǎn)品陣容。到目前為止，NVIDIA已經(jīng)推出

2022-09-21 09:44:31

6592

可適配NVIDIA Jetson Orin NX和Orin Nano的工業(yè)級準系統(tǒng)，研華EPC-R7300助力產(chǎn)品開發(fā)

2023 年，工業(yè)嵌入式AI解決方案供應商研華科技發(fā)布工業(yè)準系統(tǒng) EPC-R7300，該產(chǎn)品適用于NVIDIA?Jetson Orin?NX及JetsonOrin?Nano模塊。利用強大

2023-04-26 16:47:58

767

110991725

NVIDIA JETSON AGX ORIN DEV KIT

2024-03-14 22:29:40

NVIDIA英偉達 GPU廠商招聘軟件類職位（上海/深圳）

Hi, 大家好，全球知名GPU廠商NVIDIA，熱招軟件測試、測試開發(fā)等相關(guān)職位。眾所周知，目前NV的深度學習、CUDA非?；馃?，是IT/AI行業(yè)最火的企業(yè)之一，股價更是在一年之類翻了三倍?，F(xiàn)今所招

2017-09-06 11:01:52

NVIDIA英偉達上海急招ASIC前端設(shè)計工程師

親們，NVIDIA上海最近急招多位ASIC Design Engineer, 需要3年及以上工作經(jīng)驗的。以下是職位描述，有興趣的童鞋可以將簡歷發(fā)至：sasu@nvidia.com 或者加QQ詳聊

2014-05-05 16:59:15

NVIDIA英偉達上海急招實驗室技術(shù)員

親們，NVIDIA上海急招Lab Technician實驗室技術(shù)員, 有興趣的童鞋可以將簡歷發(fā)至：hshen@nvidia.com,或者加QQ了解詳細：910137991.以下是職位描述：Job

2014-04-25 17:43:47

NVIDIA英偉達急招客戶質(zhì)量工程師(小米手機)，locate：廊坊/...

親們， NVIDIA英偉達急招客戶質(zhì)量工程師(小米手機)，要求兩年以上主板維修經(jīng)驗，1~2年功能測試經(jīng)驗，熟悉SMT流程的優(yōu)先。有興趣的童鞋可以加QQ：910137991 或者直接將簡歷發(fā)至

2014-03-25 14:30:13

NVIDIA仍不死心，再次加入ARM站場

加強聯(lián)發(fā)科芯片在游戲和AI方面的功能與性能，計劃最早于2024年將含有英偉達圖形技術(shù)的GPU集成到聯(lián)發(fā)科的芯片上。目前聯(lián)發(fā)科已成為Chromebook系統(tǒng)芯片的領(lǐng)先供應商之一，不少廉價

2023-05-28 08:51:03

Nvidia 招聘MOBILE OEM QA ENGINEER，base在北京

Nvidia 英偉達招募MOBILE OEM QA 人才，歡迎投遞簡歷至hshen@nvidia.com. 感興趣的業(yè)內(nèi)大師可聯(lián)系我， MSN

2012-07-06 14:45:26

Nvidia/ARM交易，能怎樣為下一個計算機時代創(chuàng)造主導的生態(tài)系統(tǒng)

在過去的幾周中，有許多關(guān)于Nvidia收購Arm的提議的報道。有關(guān)該消息的消息大多困擾著阿姆的現(xiàn)有所有者軟銀以310億美元的價格收購了ARM，以及英偉達是否可以支付如此驚人的價格來購買該資產(chǎn)。ARM

2020-09-07 09:49:42

nvidia收購mellanox

nvidia收購mellanox，目錄Mellanox能給英偉達帶來什么？mellanox以太網(wǎng)卡以太網(wǎng)卡 - 概述Mellanox 10/25/40/50/56/100/200GbE聚合網(wǎng)絡(luò)網(wǎng)卡

2021-07-28 06:22:04

英偉達 VS. 英特爾：后浪來襲！精選資料分享

上周三，也就是2020年7月8日，是個值得在歷史上留下一筆的日子。在這一天美股收盤之后，英偉達的股價收漲2.3%，來到404美元，這...

2021-07-29 07:07:26

英偉達DPU的過“芯”之處

，從而在這兩個領(lǐng)域更好地替代CPU，從而釋放CPU的算力給到其他更多應用。英偉達在DPU上的技術(shù)突破，來自于去年收購以色列芯片制造公司Mellanox之后，在這家公司的硬件基礎(chǔ)上開發(fā)出BlueFeild

2022-03-29 14:42:53

英偉達GPU卡多卡互聯(lián)NVLink，系統(tǒng)累積的公差，是怎么解決的？是連接器吸收的？

英偉達不斷推出GPU卡，并且實現(xiàn)多卡互聯(lián)NVLink，實際整個系統(tǒng)會累積到一個較大的公差，而目前市面上已有的連接器只能吸收較少的公差，這個是怎么做到匹配的呢？

2022-03-05 16:17:06

英偉達GPU慘遭專業(yè)礦機碾壓，黃仁勛宣布砍掉加密貨幣業(yè)務(wù)！

`世界最大的顯卡和圖形芯片制造商英偉達正式宣布退出加密貨幣業(yè)務(wù)。公司首席財務(wù)官Colette Kress在聲明中表示：“我們認為公司已經(jīng)進入一個正常時期，公司在預期的未來內(nèi)并沒有加密貨幣業(yè)務(wù)。我們在

2018-08-24 10:11:50

英偉達TX2手冊

英偉達TX2數(shù)據(jù)手冊，喜歡請關(guān)注

2018-01-07 22:08:07

英偉達發(fā)布新一代 GPU 架構(gòu)圖靈和 GPU 系列 Quadro RTX

在 8 月 14 日的 SIGGRAPH 2018 大會上，英偉達 CEO 黃仁勛正式發(fā)布了新一代 GPU 架構(gòu) Turing（圖靈），以及一系列基于圖靈架構(gòu)的 GPU，包括全球首批支持即時光線追蹤

2018-08-15 10:59:45

ADI、瑞薩電子等知名芯片廠商的ADAS經(jīng)典解決方案合集

ADAS經(jīng)典方案合集在ADAS影像處理器領(lǐng)域，各大芯片廠商亦正強力布局，諸如ADI推出了先進的ADAS視覺處理器、TI推出集成了DSP處理器和FPGA芯片的Jacinto 系列SoC 異構(gòu)處理器

2020-06-02 15:09:59

AI芯片界的領(lǐng)頭羊進軍機器人行業(yè)

機器，并使用Jetson Xavier進行硬件在環(huán)測試。提早轉(zhuǎn)型，英偉達開啟人工智能之路作為一家圖像處理芯片公司，Nvidia約在7年前就已經(jīng)開始轉(zhuǎn)型布局人工智能。當時人工智能概念還未興起，AI仍是一片藍

2018-06-11 08:20:23

AI開發(fā)者福音！阿里云推出國內(nèi)首個基于英偉達NGC的GPU優(yōu)化容器

摘要： 3月28日，在2018云棲大會·深圳峰會上，阿里云宣布與英偉達GPU 云合作（NGC），開發(fā)者可以在云市場下載NVIDIA GPU 云鏡像和運行NGC 容器，來使用阿里云上的NVIDIA

2018-04-04 14:39:24

[招聘] 【NVIDIA - 深圳】EMBEDDED SOFTWARE ENGINEER

在高性能計算機中利用 GPU 來推動科學技術(shù)進步。英偉達公司在全球范圍內(nèi)擁有 2,300 多項專利，其中涵蓋了關(guān)乎現(xiàn)代計算之根本的諸多理念。更多詳情請看： http://www.nvidia

2012-07-04 11:25:04

【NVIDIA英偉達】招聘QA Engineer

Hi，各位工程師們，金三銀四，不如現(xiàn)在 —NVIDIA 最新開放職位，“職”為你而來?。]錯，作為GPU的發(fā)明者，NVIDIA過去一年斬獲殊榮無限，這一切皆因我們有一群如你一樣為夢想不斷奮斗的員工

2017-03-03 11:19:47

【NVIDIA社招】英偉達上海熱招ASIC驗證工程師

【NVIDIA社招】英偉達上海熱招ASIC驗證工程師一．公司簡介 NVIDIA (英偉達?)公司(納斯達克代碼：NVDA)是全球視覺計算技術(shù)的行業(yè)領(lǐng)袖及GPU(圖形處理器)的發(fā)明者。作為高性能處理器

2016-11-11 17:38:35

【NVIDIA社招】英偉達上海熱招ASIC驗證工程師

2016-09-26 10:14:45

【Nvidia英偉達上海熱招】ASIC Power Engineer

[size=18.6667px]有競爭力薪資！團隊氛圍好！關(guān)注個人發(fā)展！[size=18.6667px]投遞郵箱：nahu@nvidia.com職位簡介：·與design工作密切掛鉤·能更全面的了解

2017-06-28 10:45:29

【英偉達Nvidia上海社招】ASIC PD Engineer

有專長的知識，物理整合和時序分析需要對綜合，網(wǎng)表質(zhì)量檢查，形式驗證，芯片整體的物理需求有深入的了解。同時對靜態(tài)時序分析，時鐘結(jié)構(gòu)的調(diào)整和優(yōu)化，功耗的優(yōu)化有深入的了解。 NVIDIA的芯片規(guī)模大，工藝

2017-07-21 18:01:25

【英偉達Nvidia上海社招】ASIC PD Engineer

2017-08-10 18:46:49

【實習】NVIDIA 英偉達實習生招聘

有興趣的同學，將簡歷投遞至harryf@nvidia.com 所有職位都是base在上

2016-01-21 15:44:42

恩智浦S32V/英偉達DRIVE PX2/TI的TDA4/寒武紀1M/高通SA8155對比分析哪個好？

2021-09-30 07:03:20

手機芯片與電腦芯片精選資料分享

達NVIDIA），保護芯片，運算芯片等等，當然還有通用芯片（TI,德州儀器DSP）。cpu(中央處理器）：主要解釋計算機指令以及處理數(shù)據(jù)（數(shù)值與非數(shù)值數(shù)據(jù)），是電腦與手機控制與運算的核心。架構(gòu)分為ARM...

2021-07-29 07:22:11

瑞芯微和英偉達的邊緣計算盒子方案，你會選哪一家的？

機，miniPC整機，工控一體機，零售機和快遞柜等需要邊緣計算的場景。 #3英偉達NVIDIA Jetson Xavier NX 21T算力機器人無人值守設(shè)備智能邊緣盒子方案介紹這是一款

2022-09-29 14:31:40

聯(lián)發(fā)科回應結(jié)盟英偉達合攻 Arm 架構(gòu)芯片傳聞

外界推測英偉達將與聯(lián)發(fā)科共同宣布雙方在 Arm PC 相關(guān)芯片的合作，但聯(lián)發(fā)科發(fā)布公告表示，這個傳聞純屬外界猜測，聯(lián)發(fā)科不做任何評論。外界認為，根據(jù)聯(lián)發(fā)科的活動邀請函內(nèi)容來看，將展示該公司產(chǎn)品在智能生活、移動通信、車用電子三領(lǐng)域的先進技術(shù)應用，持續(xù)朝向跨領(lǐng)域、跨平臺產(chǎn)品組合

2023-05-28 08:47:33

超越英偉達Pascal五倍？揭秘英特爾深度學習芯片架構(gòu) 精選資料推薦

在被英特爾收購兩年之后，深度學習芯片公司 Nervana 終于準備將代號為「Lake Crest」的架構(gòu)轉(zhuǎn)化為實際的產(chǎn)品了。對于英特爾來說，現(xiàn)在入局或許有些遲到，英偉達已經(jīng)占據(jù)深度學習芯片市場很長一段時間了，后者有充分的時間通過新...

2021-07-26 07:04:35

高端VR設(shè)備起量，英偉達稱今年1500萬，明年翻倍

VR-ready PC的銷量已經(jīng)突破1500萬臺。　　在本周的VRX大會上，英偉達總經(jīng)理格林斯特恩確認了這一消息，使用英偉達GeForce芯片的VR-ready PC銷量已經(jīng)突破1500萬臺，明年年底這一

2016-12-13 14:32:48

197.再次無理打壓！美國命令英偉達對中俄出售高端GPU需要新的許可

gpu英偉達

小凡發(fā)布于 2022-10-04 12:25:19

4616

NVIDIA 2020年下半年推出自動駕駛出租車，采用NVIDIA Drive平臺

作為GTC CHINA 2019上唯一發(fā)布的硬件，NVIDIA DRIVE AGX Orin光從硬件參數(shù)上看已經(jīng)十分亮眼，包括170億個晶體管，8核64位CPU，200TOPS深度學習算力。在演

2019-12-23 16:33:46

3297

理想汽車將在2022年使用NVIDIA Orin系統(tǒng)級芯片

9月22日，理想汽車與人工智能計算公司英偉達（NVIDIA）及英偉達中國合作伙伴德賽西威在北京簽訂三方戰(zhàn)略合作協(xié)議。理想汽車將在2022年推出的產(chǎn)品上使用NVIDIA Orin系統(tǒng)級芯片。

2020-09-26 11:03:33

3734

理想汽車將推出的全尺寸擴展型智能SUV中使用NVIDIA Orin芯片

Li Auto今天在北京與NVIDIA和NVIDIA中國合作伙伴Huizhou Desay SV Auto簽署了三方戰(zhàn)略合作伙伴協(xié)議。NVIDIA Orin片上系統(tǒng)于2019年發(fā)布，計劃于2022年投入產(chǎn)。

2020-09-30 13:57:56

2057

蔚來 ET7 電動汽車搭載四顆英偉達 Orin 芯片

蔚來 ET7 搭載四顆英偉達 Orin 芯片：8096CUDA 核心,cuda,芯片,英偉達,nvidia,蔚來,顯卡

2021-02-20 14:33:37

4664

英偉達最新推出的自動駕駛芯片Atlan詳解

英偉達在2019年12月推出Orin后沉寂一年半推出新一代自動駕駛SoC，即Atlan，從命名來看，Nvidia 還在使用《海王》（Aquaman）系列中的名字。在2019年開始，Nvidia宣布

2021-04-19 14:13:16

10478

高合汽車將采用NVIDIA DRIVE Orin作為核心計算芯片

Z上。高合汽車下一代智能駕駛輔助平臺（ADAS）將配備超高算力的 NVIDIA DRIVE Orin 系統(tǒng)級芯片，將最新的科技創(chuàng)新與豪華汽車的特性結(jié)合起來，成為

2021-11-15 15:19:51

2600

QCraft率先使用NVIDIA DRIVE Orin方案

11月9日，在NVIDIA GTC大會上，世界前沿的無人駕駛通用方案公司輕舟智航（QCraft）宣布將在其Driven-by-QCraft下一代硬件方案中率先使用NVIDIA DRIVE Orin

2021-11-15 16:22:43

1523

NVIDIA推出Jetson AGX Orin機器人計算機

NVIDIA (英偉達)邊緣計算是利用GPU-AI-服務(wù)器-GEFORCE-液冷-BIM技術(shù)，應用于元宇宙-基因大時代-人工智能-大數(shù)據(jù)-數(shù)字孿生-云計算-深度學習-數(shù)據(jù)分析-IOT-機器學習-人臉

2021-11-18 16:00:07

721

元戎啟行采用英偉達Drive Orin芯片，為L4級自動駕駛前裝量產(chǎn)打造車規(guī)級方案

3月23日，英偉達GTC 2022 大會期間，自動駕駛獨角獸企業(yè)元戎啟行宣布采用英偉達Drive Orin系統(tǒng)級芯片，為L4級自動駕駛前裝量產(chǎn)打造車規(guī)級方案。

2022-03-23 15:35:41

2064

自動駕駛備受關(guān)注小馬智行完成D輪融資英偉達將量產(chǎn)自動駕駛芯片DRIVE Orin

自動駕駛備受關(guān)注小馬智行完成D輪融資英偉達將量產(chǎn)自動駕駛芯片DRIVE Orin 很多車企都在積極地布局自動駕駛；連特斯拉CEO馬斯克都認為自動駕駛將是他最優(yōu)先要解決的重大問題。小馬智行完成

2022-03-30 21:19:57

3002

NVIDIA發(fā)布最新Orin芯片提升邊緣AI標桿

在首次參加行業(yè) MLPerf 基準測試時，基于 NVIDIA Ampere 架構(gòu)的低功耗系統(tǒng)級芯片 NVIDIA Orin 就創(chuàng)造了新的AI推理性能紀錄，并在邊緣提升每個加速器的性能。

2022-04-08 10:14:44

4200

NVIDIA Jetson AGX Orin提升邊緣AI標桿

最新發(fā)布的 NVIDIA Jetson AGX Orin 提升邊緣 AI 標桿，使我們在最新一輪行業(yè)推理基準測試中的領(lǐng)先優(yōu)勢更加明顯。

2022-04-09 08:24:14

1192

移遠通信5G通信模組與英偉達Jetson AGX Orin平臺完成聯(lián)調(diào)

上海，2022年5月24日 – 全球領(lǐng)先的物聯(lián)網(wǎng)整體解決方案供應商移遠通信今日宣布，其5G通信模組已經(jīng)成功與英偉達Jetson AGX Orin平臺完成聯(lián)調(diào)。

2022-05-24 17:10:08

1775

工業(yè)富聯(lián)采用基于英偉達的超級芯片NVIDIA Grace CPU

5月24日，工業(yè)富聯(lián)宣布采用基于英偉達NVIDIA HGX、OVX和CGX系統(tǒng)設(shè)計的超級芯片NVIDIA Grace CPU和NVIDIA Grace Hopper Superchip，以滿足超級數(shù)據(jù)中心及邊緣運算等更高的算力需求。

2022-05-26 15:17:55

3295

NVIDIA助力集度發(fā)布首款汽車機器人概念車

由 NVIDIA DRIVE Orin 提供硬件和算力支持的集度汽車機器人概念車將于 6 月 8 日集度 ROBODAY 亮相。

2022-06-08 10:51:09

869

NVIDIA為Orin開發(fā)套件提供更加輕松的系統(tǒng)安裝方式

NVIDIA 為 Orin 開發(fā)套件提供更加輕松的系統(tǒng)安裝方式。

2022-06-29 10:55:29

1583

NVIDIA Isaac Nova Orin的特性介紹

Isaac Nova Orin 是一款先進的計算和傳感器平臺，可加速 AMR 開發(fā)和部署；Isaac Nova Orin 由多達兩臺 Jetson AGX Orin 計算機和一套適用于新一代 AMR 的傳感器套件組成。

2022-08-19 14:34:58

868

NVIDIA推出全新Jetson Orin Nano系統(tǒng)級模組

NVIDIA 推出全新Jetson Orin Nano 系統(tǒng)級模組，擴充了NVIDIA Jetson產(chǎn)品陣容。全新Jetson Orin Nano的性能比上一代產(chǎn)品提高了 80 倍，成為入門級邊緣 AI 和機器人技術(shù)的新基準。

2022-09-22 09:54:43

924

英偉達算力頂流Thor芯片發(fā)布可取代駕駛艙芯片工作

　　據(jù)消息報道，Nvidia最近發(fā)布了最新一代智能芯片Thor，其計算能力高達2000 Tops，是Orin X芯片的八倍。在Thor發(fā)布后，極氪是第一個宣布將在2025年為其型號配備Thor芯片的公司。

2022-09-23 09:44:08

971

NVIDIA Nova Orin平臺助力AMR的構(gòu)建和部署

NVIDIA 發(fā)布了Nova Orin（一種自主移動機器人 (AMR) 參考平臺）的更新，從而推進其路線圖。我們將發(fā)布三種參考平臺配置的詳細信息：兩種使用單個Jetson AGX Orin，另外一種

2022-09-26 09:45:22

998

研揚同步在GTC中宣布NVIDIA Jetson Orin Nano 邊緣計算AI平臺BOXER-8621AI上市

采用NVIDIA Jetson Orin Nano系統(tǒng)模塊的BOXER-8621AI （臺北，中國臺灣，2022年9月22日）專業(yè)物聯(lián)網(wǎng)及人工智能邊緣運算平臺研發(fā)制造大廠—研揚科技，今日

2022-09-27 11:34:09

1192

NVIDIA DRIVE Orin助力理想實現(xiàn)全場景的智能輔助駕駛功能

隨著車型陣容的擴大，理想汽車已開始使用基于雙 NVIDIA DRIVE Orin 系統(tǒng)級芯片的軟件定義計算平臺來部署最新的自動駕駛功能，其中就包括了理想旗下三款車型，理想 L9、理想 L8 Max、理想 L7 Max。

2022-10-09 17:05:11

702

使用NVIDIA Jetson Orin Nano解決入門級邊緣人工智能挑戰(zhàn)

2022 年 GTC ， NVIDIA 宣布 Jetson Orin Nano 系列系統(tǒng)模塊（ SoM ）。它們的 AI 性能是 NVIDIA Jetson Nano 的 80 倍，為入門級邊緣 AI 和機器人應用設(shè)定了新標準。

2022-10-11 14:47:18

1760

NVIDIA Jetson Orin Nano的性能基準

在本次 GTC 大會上，NVIDIA 發(fā)布了Jetson Orin Nano系列的系統(tǒng)級模組（SoM）。其 AI 性能是 NVIDIA Jetson Nano 的 80 倍，成為入門級邊緣 AI 和機器人技術(shù)的新基準。

2022-10-12 09:55:05

1992

開發(fā)者們好評如潮，NVIDIA Jetson AGX Orin 是怎么做到的？

NVIDIA Jetson AGX Orin 自推出以來，收獲了許多開發(fā)者們的喜愛和支持。這款性能強大、尺寸緊湊且節(jié)能的 AI 超級計算機適用于先進的機器人、自主機器以及新一代嵌入式和邊緣計算

2022-12-15 19:35:06

807

芯聞富士康與英偉達合作打造自動駕駛平臺比亞迪百萬級高端品牌“仰望”發(fā)布

基于NVIDIA DRIVE Orin的電子控制單元（ECU）。英偉達的DRIVE Orin芯片芯片專為網(wǎng)聯(lián)和自動駕駛汽車的計算而設(shè)計，這一ECU將服務(wù)于全球汽車市場；雙方將共同助力業(yè)界打造高能效的自動駕駛汽車。 ? ? ? ?而富士康早已經(jīng)確定要加大馬力造車，進軍

2023-01-06 09:48:59

770

淺析ADAS域控制器關(guān)鍵組件

在CPU選型上，各家域控制器為達到NOP/NGP等L2+級高階ADAS功能，均在追求大算力芯片，目前應用較多的是英偉達Xavier和Orin。

2023-01-31 14:02:29

2112

繼CES 2023之后，研揚科技宣布增加基于最新NVIDIA Jetson Orin系統(tǒng)化模塊的AI邊緣 Box PC系列

繼消費電子展(CES)之后，研揚科技推出了一系列備受贊譽、由最新NVIDIA?Jetson Orin?系統(tǒng)化模塊平臺提供支持的AI邊緣解決方案。

2023-02-14 11:55:14

340

GTC23 | 使用 NVIDIA Jetson Orin Nano 開發(fā)套件開發(fā) AI 機器人及智能視覺系統(tǒng)

NVIDIA Jetson Orin Nano Developer Kit? 為創(chuàng)建入門級 AI 機器人、智能無人機和智能視覺系統(tǒng)設(shè)定了一個新標準，同時簡化了? NVIDIA Jetson Orin

2023-03-29 03:40:04

987

Jetson Orin Nano納米刷機介紹

NVIDIA Jetson Orin Nano 系列模型以最小的 Jetson 外形提供高達 40 TOPS 的 AI 算力，性能在 7W 至 15W 之間，算力相當于當是 NVIDIA Jetson Nano 的 80 倍GB 和仸佾4。版本，其中開發(fā)套件是8GB版本。

2023-04-01 09:55:33

2053

使用 NVIDIA IGX Orin 開發(fā)套件加速邊緣 AI 之旅

在一個包裹中，并且預先組裝在了一起，從而為你節(jié)省時間和花費。 NVIDIA IGX Orin ? 為邊緣 AI 應用程序開發(fā)人員提供了類似的工具包：一個優(yōu)化的一體式平臺。NVIDIA IGX Orin 是第一個將工業(yè)級硬件與企業(yè)級軟件相結(jié)合，并支持邊緣 AI 管理的平

2023-04-08 00:30:07

333

CNC工藝全鋁外殼5G模組搭配Jetson Orin NX使用演示 RM500U FM650

關(guān)鍵詞：CNC工藝 USB3.0 type C 全鋁外殼 R2S RK3328 FM650 RM500U 5G LTE Ubuntu 英偉達 Nvidia Jetson Orin NX

2023-04-13 10:36:33

588

攜手英偉達，RoboSense速騰聚創(chuàng)正式入駐NVIDIA Omniverse生態(tài)系統(tǒng)

#RoboSense 與#英偉達強強聯(lián)手，"第二代智能固態(tài)激光雷達+Orin芯片"智駕方案，結(jié)合強大的NVIDIA Omniverse生態(tài)系統(tǒng)，高效驅(qū)動智能駕駛規(guī)?；瘧?，共推全球汽車及自動駕駛產(chǎn)業(yè)發(fā)展。

2023-05-22 10:37:49

299

NVIDIA 推出 Jetson AGX Orin 工業(yè)級模塊助力邊緣 AI

Jetson 邊緣 AI 和機器人平臺，您可以在此類復雜的環(huán)境中部署 AI 和傳感器融合算法。 NVIDIA 在 COMPUTEX 2023 上發(fā)布了全新 Jetson AGX Orin 工業(yè)級模塊，在惡劣

2023-06-05 10:45:02

716

詳解英偉達芯片在自動駕駛的軟件移植設(shè)計開發(fā)

整體上看，Orin系列芯片頂層SOC架構(gòu)的模塊主要由三部分處理單元組成：即 CPU、GPU 和硬件加速器組成。以當前較火的Orin-x作為典型說明英偉達芯片在其軟件模塊開發(fā)中是如何進行調(diào)用的。

2023-06-06 15:37:26

730

繼CES 2023之后，研揚科技宣布增加基于最新NVIDIA Jetson Orin系統(tǒng)化模塊的AI邊緣 Box PC系列

繼消費電子展(CES)之后，研揚科技推出了一系列備受贊譽、由最新NVIDIA?Jetson Orin?系統(tǒng)化模塊平臺提供支持的AI邊緣解決方案。

2023-02-15 11:43:02

493

ADAS域控季報：L2+及以上ADAS域控主芯片市場份額

2023年Q1，中國乘用車市場（不含進口車）配置L2+及以上自動駕駛功能車型銷量達到36.0萬輛，同比增長68.2%。這36.0萬輛L2+及以上車型共計搭載ADAS主控芯片65.6萬顆，其中采用芯片自研策略的特斯拉FSD芯片占比41.7%；主攻高算力芯片的英偉達芯片約19.0萬顆，占比29.0%。

2023-07-20 15:14:03

1527

NVIDIA DRIVE Orin 助力騰勢 N7 實現(xiàn)全場景智能駕駛輔助

，請聯(lián)系騰勢汽車）騰勢 N7 已于 7 月 3 日全球正式上市，全系車型支持選配由 NVIDIA DRIVE Orin 系統(tǒng)級芯片賦能的高階智駕全享包。騰勢 N7 共推出 6 款車型，提供兩種動力

2023-07-21 16:50:03

642

安提國際推出基于NVIDIA Jetson Orin的新型無風扇邊緣AI系統(tǒng)

新北市2023年8月3日?/美通社/ --?安提國際推出了基于NVIDIA Jetson Orin系統(tǒng)模塊（system-on-module；SoM）的全新無風扇邊緣計算系統(tǒng)。這些具緊湊硬件結(jié)構(gòu)

2023-08-04 10:41:20

355

使用 DLA 在 NVIDIA Jetson Orin 上最大限度地提高深度學習性能

NVIDIA Jetson Orin 是同類嵌入式人工智能平臺中的翹楚。 Jetson Orin SoC 模塊以 NVIDIA Ampere 架構(gòu) GPU 為核心，但 SoC 上還有更多的計算功能

2023-08-22 19:20:05

509

美芯片禁令再次擴大，波及英偉達、AMD以及intel等科技公司

　　拜登政府17日宣布，計劃停止英偉達（Nvidia）、超微半導體以及英特爾等科技公司設(shè)計的先進AI芯片輸出中國大陸，英偉達（Nvidia）昨日股價重挫4.68%至每股439.38美元；天風國際證券

2023-10-18 13:53:41

488

英偉達“閹割版”AI芯片遇阻，推遲至明年發(fā)布

近日，英偉達（Nvidia）為遵守美國出口規(guī)定而推遲在中國市場推出的新款人工智能（AI）芯片引起了業(yè)界廣泛關(guān)注。

2023-11-28 14:20:52

455

英偉達：四家中國車企選其自動駕駛芯片平臺

據(jù)英偉達透露，理想汽車已選定搭載兩顆DRIVE Orin處理器且具備508TOPS算力的NVIDIA DRIVE Thor車載計算機，進而實現(xiàn)實時融合各類傳感器采集的信息，推動高級輔助駕駛系統(tǒng)（ADAS）等全場景自動駕駛系統(tǒng)的運作。

2024-01-09 09:21:43

374