AI芯片 CPU+xPU的異構方案全面解析

本文來自“算力大時代，AI算力產(chǎn)業(yè)鏈全景梳理(2023)”，從廣義上講，能運行AI?算法的芯片都叫AI?芯片。CPU、GPU、FPGA、NPU、ASIC?都能執(zhí)行AI?算法，但在執(zhí)行效率層面上有巨大的差異。CPU?可以快速執(zhí)行復雜的數(shù)學計算，但同時執(zhí)行多項任務時，CPU?性能開始下降，目前行業(yè)內(nèi)基本確認CPU?不適用于AI?計算。

CPU+xPU?的異構方案成為大算力場景標配，GPU為應用最廣泛的?AI?芯片。目前業(yè)內(nèi)廣泛認同的AI?芯片類型包括GPU、FPGA、NPU?等。由于?CPU?負責對計算機的硬件資源進行控制調(diào)配，也要負責操作系統(tǒng)的運行，在現(xiàn)代計算系統(tǒng)中仍是不可或缺的。GPU、FPGA?等芯片都是作為?CPU?的加速器而存在，因此目前主流的?AI計算系統(tǒng)均為?CPU+xPU?的異構并行。CPU+GPU?是目前最流行的異構計算系統(tǒng)，在?HPC、圖形圖像處理以及AI?訓練/推理等場景為主流選擇。IDC?數(shù)據(jù)顯示，2021?年中國?AI?芯片市場中，GPU?市占率為?89%。

在GPU?問世以后，NVIDIA?及其競爭對手?ATI（被?AMD?收購）一直在為他們的顯卡包裝更多的功能。2006?年?NVIDIA?發(fā)布了?CUDA?開發(fā)環(huán)境，這是最早被廣泛應用的?GPU?計算編程模型。CUDA?將?GPU?的能力向科學計算等領域開放，標志著?GPU?成為一種更通用的計算設備?GPGPU（General Purpose GPU）。NVIDIA?也在之后推出了面向數(shù)據(jù)中心的?GPU?產(chǎn)品線。

GPU?性能提升與功能豐富逐步滿足?AI?運算需要。2010?年?NVIDIA?提出的?Fermi?架構是首個完整的?GPU計算架構，其中提出的許多新概念沿用至今。Kepler?架構在硬件上擁有了雙精度計算單元（FP64），并提出?GPUDirect?技術，繞過?CPU/System Memory，與其他?GPU?直接進行數(shù)據(jù)交互。Pascal?架構應用了第一代?NVLink。

Volta?架構開始應用?Tensor Core，對?AI?計算加速具有重要意義。簡要回顧?NVIDIA GPU?硬件變革歷程，工藝、計算核心數(shù)增加等基礎特性的升級持續(xù)推動性能提升，同時每一代架構所包含的功能特性也在不斷豐富，逐漸更好地適配?AI?運算的需要。

AI?的數(shù)據(jù)來源廣泛，GPU?逐漸實現(xiàn)對各類數(shù)據(jù)類型的支持。依照精度差異，算力可從?INT8（整數(shù)類型）、FP16（半精度）、FP32（單精度）、FP64（雙精度）等不同維度對比。AI?應用處理的數(shù)據(jù)包括文字、圖片或視頻，數(shù)據(jù)精度類型差異大。對于數(shù)據(jù)表征來講，精度越高，準確性越高；但降低精度可以節(jié)省運算時間，減少成本。

總體來看，精度的選擇需要在準確度、成本、時間之間取得平衡。目前許多?AI?模型中運行半精度甚至整形計算即可完成符合準確度的推理和訓練。隨著架構的迭代，NVIDIA GPU?能支持的數(shù)據(jù)類型持續(xù)豐富，例如?Turing架構?T4?開始支持?INT8，Ampere?架構?A100?的?Tensor Core?開始支持TF32。

均衡分配資源的前提下，處理低精度的硬件單元數(shù)量更多，表現(xiàn)更高的算力性能。GPU?作為加速器得到廣泛應用一定程度上得益于它的通用性，為了在不同精度的數(shù)據(jù)類型上具有良好的性能，以兼顧?AI、科學計算等不同場景的需要，英偉達在分配處理不同數(shù)據(jù)類型的硬件單元時大體上保持均衡。因為低精度數(shù)據(jù)類型的計算占用更少的硬件資源，同一款?GPU?中的處理低精度數(shù)據(jù)類型的硬件單元的數(shù)量較多，對應計算能力也較強。以V100?為例，每個?SM?中?FP32?單元的數(shù)量都為?FP64?單元的兩倍，最終?V100?的?FP32?算力（15.7 TFLOPS）也近似為?FP64（7.8 TFLOPS）的兩倍，類似的規(guī)律也可以在各代架構旗艦?P100、A100?和?H100?中看到。

GPU?引入特殊硬件單元加速?AI?的核心運算環(huán)節(jié)。矩陣-矩陣乘法（GEMM）運算是神經(jīng)網(wǎng)絡訓練和推理的核心，本質(zhì)是在網(wǎng)絡互連層中將大矩陣輸入數(shù)據(jù)和權重相乘。矩陣乘積的求解過程需要大量的乘積累加操作，而?FMA（Fused Multiply–accumulate operation，融合乘加）可以消耗更少的時鐘周期來完成這一過程。傳統(tǒng)?CUDACore?執(zhí)行?FMA?指令，硬件層面需要將數(shù)據(jù)按寄存器->ALU->寄存器->ALU->寄存器的方式來回搬運。2017?年發(fā)布的?Volta?架構首度引入了?Tensor Core（張量核心），是由?NVIDIA?研發(fā)的新型處理核心。根據(jù)?NVIDIA?數(shù)據(jù)，Volta Tensor Core?可以在一個?GPU?時鐘周期內(nèi)執(zhí)行?4×4×4=64?次?FMA操作，吞吐量是?Pascal?架構下?CUDA Core的12?倍。

Tensor Core?持續(xù)迭代提升其加速能力。Volta?架構引入?Tensor Core?的改動使?GPU?的?AI?算力有了明顯提升，后續(xù)在每一代的架構升級中，Tensor Core?都有比較大的改進，支持的數(shù)據(jù)類型也逐漸增多。以?A100?到?H100為例，Tensor Core?由?3.0?迭代至?4.0，H100?在?FP16 Tensor Core?的峰值吞吐量提升至?A100?的?3?倍。同時，H100Tensor Core?支持新的數(shù)據(jù)類型?FP8，H100 FP8 Tensor Core?的吞吐量是?A100 FP16 Tensor Core?的?6?倍。

Tensor Core?加速下，低精度比特位寬的算力爆發(fā)式增長，契合?AI?計算需要。Tensor Core?的應用使算力快速、高效增長，選取?Pascal?至?Hopper?架構時期每一代的旗艦數(shù)據(jù)中心顯卡，對比經(jīng)?Tensor Core?加速前后的?FP16算力指標可以得到：（1）經(jīng)?Tensor Core?加速的?FP16?算力明顯高于加速之前。（2）每單位?Tensor core?支持的算力明顯高于每單位?Cuda Core?支持的算力。同時，Tensor Core?從?2017?年推出以來首先完善了對低精度數(shù)據(jù)類型的支持，順應了?AI?發(fā)展的需要。

數(shù)據(jù)訪問支配著計算能力利用率。AI?運算涉及到大量數(shù)據(jù)的存儲與處理，根據(jù)?Cadence?數(shù)據(jù)，與一般工作負載相比，每臺?AI?訓練服務器需要?6?倍的內(nèi)存容量。而在過去幾十年中，處理器的運行速度隨著摩爾定律高速提升，而?DRAM?的性能提升速度遠遠慢于處理器速度。目前?DRAM?的性能已經(jīng)成為了整體計算機性能的一個重要瓶頸，即所謂阻礙性能提升的“內(nèi)存墻”。除了性能之外，內(nèi)存對于能效比的限制也成為一個瓶頸，Cadence數(shù)據(jù)顯示，在自然語言類?AI?負載中，存儲消耗的能量占比達到?82%。

GPU?采用高帶寬?HBM?降低“內(nèi)存墻”影響。為防止占用系統(tǒng)內(nèi)存并提供較高的帶寬和較低的延時，GPU均配備有獨立的的內(nèi)存。常規(guī)的?GDDR?焊接在?GPU?芯片周邊的?PCB?板上，與處理器之間的數(shù)據(jù)傳輸速率慢，并且存儲容量小，成為運算速度提升的瓶頸。HBM?裸片通過?TSV?進行堆疊，然后?HBM?整體與?GPU?核心通過中介層互連，因此?HBM?獲得了極高的帶寬，并節(jié)省了?PCB?面積。目前，GDDR?顯存仍是消費級?GPU?的行業(yè)標準，HBM?則成為數(shù)據(jù)中心?GPU?的主流選擇。

硬件單元的改進與顯存升級增強了單張?GPU?算力的釋放，然而，隨著?Transformer?模型的大規(guī)模發(fā)展和應

用，模型參數(shù)量呈爆炸式增長，GPT-3?參數(shù)量達到了?1750?億，相比?GPT?增長了近?1500?倍，預訓練數(shù)據(jù)量更是

從?5GB?提升到了?45TB。大模型參數(shù)量的指數(shù)級增長帶來的諸多問題使?GPU?集群化運算成為必須：

（1）即使最先進的?GPU，也不再可能將模型參數(shù)擬合到主內(nèi)存中。

（2）即使模型可以安裝在單個?GPU?中（例如，通過在主機和設備內(nèi)存之間交換參數(shù)），所需的大量計算操作也可能導致在沒有并行化的情況下不切實際地延長訓練時間。根據(jù)?NVIDIA?數(shù)據(jù)，在?8?個?V100 GPU?上訓練一個具有?1750?億個參數(shù)的?GPT-3?模型需要?36?年，而在?512?個?V100 GPU?上訓練需要?7?個月。

NVIDIA?開發(fā)?NVLink?技術解決?GPU?集群通信。在硬件端，GPU?之間穩(wěn)定、高速的通信是實現(xiàn)集群運算所必須的條件。傳統(tǒng)?x86?服務器的互連通道?PCIe?的互連帶寬由其代際與結構決定，例如?x16 PCIe 4.0?雙向帶寬僅為?64GB/s。除此之外，GPU?之間通過?PCIe?交互還會與總線上的?CPU?操作競爭，甚至進一步占用可用帶寬。

NVIDIA?為突破?PCIe?互連的帶寬限制，在?P100?上搭載了首項高速?GPU?互連技術?NVLink（一種總線及通訊協(xié)議），GPU?之間無需再通過?PCIe?進行交互。

NVLink?繼續(xù)與?NVIDIA GPU?架構同步發(fā)展，每一種新架構都伴隨著新一代?NVLink。第四代?NVLink?為每個?GPU?提供?900 GB/s?的雙向帶寬，比上一代高?1.5?倍，比第一代?NVLink?高?5.6?倍。

NVDIA?開發(fā)基于?NVLink?的芯片?NVSwitch，作為?GPU?集群數(shù)據(jù)通信的“樞紐”。NVLink 1.0?技術使用時，一臺服務器中的?8?個?GPU?無法全部實現(xiàn)直接互連。同時，當?GPU?數(shù)量增加時，僅依靠?NVLink?技術，需要眾多數(shù)量的總線。為解決上述問題，NVIDIA?在?NVLink 2.0?時期發(fā)布了?NVSwitch，實現(xiàn)了?NVLink?的全連接。

NVSwitch?是一款?GPU?橋接芯片，可提供所需的?NVLink?交叉網(wǎng)絡，在?GPU?之間的通信中發(fā)揮“樞紐”作用。借助于?NVswitch，每顆?GPU?都能以相同的延遲和速度訪問其它的?GPU。就程序來看，16?個?GPU?都被視為一個?GPU，系統(tǒng)效率得到了最大化，大大降低了多?GPU?系統(tǒng)的優(yōu)化難度。

通過添加更多?NVSwitch?來支持更多?GPU，集群分布式運算得以實現(xiàn)。當訓練大型語言模型時，NVLink網(wǎng)絡也可以提供顯著的提升。NVSwitch?已成為高性能計算(HPC)和?AI?訓練應用中不可或缺的一部分。

編輯：黃飛

閱讀全文

FPGA(591987) FPGA(591987)
cpu(206166) cpu(206166)
gpu(126255) gpu(126255)
操作系統(tǒng)(121702) 操作系統(tǒng)(121702)
AI芯片(34268) AI芯片(34268)

安謀科技吳雄昂：迎接全新智能時代兩大挑戰(zhàn) CPU+XPU的超域架構全面發(fā)力

11月3日，在深圳大中華喜來登酒店，來自安謀科技執(zhí)行董事長兼首席執(zhí)行官吳雄昂就最新萬物智能時代的算力挑戰(zhàn)，芯片+軟件耦合應對物聯(lián)網(wǎng)需求帶來的架構挑戰(zhàn)進行了詳細解讀。算力演變?nèi)绾慰焖俑M智能物聯(lián)網(wǎng)

2021-11-03 17:10:38

7401

CPU+XPU方案，突破5G時代大算力需求

電子發(fā)燒友網(wǎng)報道（文/梁浩斌）5G商用兩年，全球5G發(fā)展顯著。截至到2021年11月，全球已經(jīng)有180個5G商用網(wǎng)絡過，5G用戶數(shù)超過5億，5G已經(jīng)成為全球通用技術，GSMA預計2025年全球?qū)⒂?05張網(wǎng)絡覆蓋125個國家。中國5G基站和連接數(shù)令人驚艷。截至11月底，工信部數(shù)據(jù)顯示，中國已建成5G基站超過115萬個，占全球70%以上，5G終端用戶超過4.5億戶，占全球80%。 ? 而在5G時代，終端上的算力需求也顯得尤為突出，特別是手機等移動終端，在影像、游戲等方面都對算力需

2022-04-21 00:54:00

2584

深度解析FPGA異構計算芯片的技術特性

來源：內(nèi)容來自騰訊架構師，作者austingao。? 1. 異構計算：WHY明明CPU用的好好的，為什么

2017-10-24 13:49:42

5773

飛騰業(yè)績2020年猛增6.8倍！CPU發(fā)力高性能計算，AI解決方案加速落地

朱大勇分析說，數(shù)字化轉(zhuǎn)型對于芯片支撐能力提出了更高要求，包括多樣化算力、高性能、低功耗和高安全性。僅僅依靠CPU是不夠的，飛騰以兩大基礎點切入：一、以CPU為代表的算力是數(shù)字經(jīng)濟發(fā)展核心

2021-07-23 09:34:05

9260

AI芯片PCIE信號完整性測試方案解析

隨著嵌入式AI芯片各種智能終端設備應用的增加，一般的處理器已經(jīng)無法滿足終端設備智能特性的需求，所以越來越多的芯片制造商側(cè)重開發(fā)AI芯片，AI芯片初創(chuàng)公司越來越多，大量風投正涌入AI芯片市場，整個AI芯片市場正蓬勃發(fā)展。

2022-09-16 10:50:54

2715

異構時代：CPU與GPU的發(fā)展演變

的特點和優(yōu)勢，能夠針對不同的應用場景進行優(yōu)化和協(xié)作，從而實現(xiàn)更高效的計算，不同類型處理器的協(xié)同計算被稱為異構計算。CPU和GPU是異構計算中最常見和最重要的兩種處理器

2023-10-24 10:17:00

484

談一談FPAI芯片的AI系統(tǒng)方案以及參考設計實例

首先，我們簡單了解下FPAI（Field Programmable AI）芯片。FPAI芯片，創(chuàng)新性地采用了異構融合架構，即在一顆die上集成了高性能SOC（PS）

2023-11-28 11:33:41

963

全球首款異構融合類腦芯片備受世界關注

清華團隊發(fā)布全球首款異構融合類腦芯片。

2019-08-10 10:09:57

1958

安謀科技重磅發(fā)布！以超域架構定義全新XPU，為智能計算提供“核芯動力”

安謀科技重磅發(fā)布“雙輪驅(qū)動”戰(zhàn)略以及新業(yè)務品牌“核芯動力”。將依托“核芯動力”向市場提供高性能、可定制化的自主架構XPU IP產(chǎn)品和服務，用CPU+XPU引領雙輪驅(qū)動。安謀科技推動計算架構升級，貼合智能計算產(chǎn)業(yè)發(fā)展趨勢，積極打造合作共贏的產(chǎn)業(yè)生態(tài)，為產(chǎn)業(yè)發(fā)展賦能。

2021-08-28 08:00:00

3708

AI芯片怎么分類？

AI芯片作為產(chǎn)業(yè)核心，也是技術要求和附加值最高的環(huán)節(jié)，在AI產(chǎn)業(yè)鏈中的產(chǎn)業(yè)價值和戰(zhàn)略地位遠遠大于應用層創(chuàng)新。騰訊發(fā)布的《中美兩國人工智能產(chǎn)業(yè)發(fā)展全面解讀》報告顯示，基礎層的處理器/芯片企業(yè)數(shù)量來看，中國有14家，美國33家。本文將對這一領域產(chǎn)業(yè)生態(tài)做一個簡單梳理。

2019-08-13 08:42:38

AI發(fā)展對芯片技術有什么影響？

現(xiàn)在說AI是未來人類技術進步的一大方向，相信大家都不會反對。說到AI和芯片技術的關系，我覺得主要體現(xiàn)在兩個方面：第一，AI的發(fā)展要求芯片技術不斷進步；第二，AI可以幫助芯片技術向前發(fā)展。

2019-08-12 06:38:51

ai芯片和gpu的區(qū)別

ai芯片和gpu的區(qū)別▌車載芯片的發(fā)展趨勢(CPU-GPU-FPGA-ASIC)過去汽車電子芯片以與傳感器一一對應的電子控制單元(ECU)為主，主要分布與發(fā)動機等核心部件上。...

2021-07-27 07:29:46

全面解析無線充電技術

扔掉電源線，給自己的智能手機進行無線充電。這對于許多人來說可能有點天方夜譚。但事實上，無線充電技術很快就要進入大規(guī)模的商用化，這項此前不為大眾所熟悉的技術，正悄然來到我們的面前。全面解析無線充電技術

2016-07-28 11:13:33

異構計算在人工智能什么作用？

的獲取上一直有比較高的門檻。今天我們重點談AI 時代的計算能力。隨著近年來硅芯片逼近物理的極限和經(jīng)濟成本高升，摩爾定律已趨近失效。使用通用處理器這個傳統(tǒng)的方法已無法滿足人工智能的各種應用對爆發(fā)的和高計算

2019-08-07 08:39:19

異構計算場景下構建可信執(zhí)行環(huán)境

異構計算場景下，如何構建可信執(zhí)行環(huán)境呢？分布式機密計算是一種思路，將CPU上的技術應用到其他的XPU上是另一種思路，但最關鍵的問題是怎么用。該問題在AI安全上非常明顯，AI模型都在GPU上，TEE想用

2023-08-15 17:35:09

異構計算的前世今生

異構計算已經(jīng)成了半導體業(yè)界不得不思考的一個話題，傳統(tǒng)通用計算的性能捉襟見肘，過去承諾的每隔一段時間芯片性能翻倍的豪言壯語已經(jīng)沒有人再提了。如今我們用到的手機中，各種除CPU以外的計算單元層出不窮

2021-12-26 08:00:00

異構集成的三個層次解析

　　第一層芯片異構　　芯片級別的異構性是設備包內(nèi)部的異構集成，與芯片概念密切相關。我們正在建造更復雜的系統(tǒng)，更大的系統(tǒng)，用大的，單片半導體建造更大的系統(tǒng)是很困難的。大模的產(chǎn)量不如小?；蛐∑暮谩Ｓ?/div>

2020-07-07 11:44:05

ADI、瑞薩電子等知名芯片廠商的ADAS經(jīng)典解決方案合集

ADAS經(jīng)典方案合集在ADAS影像處理器領域，各大芯片廠商亦正強力布局，諸如ADI推出了先進的ADAS視覺處理器、TI推出集成了DSP處理器和FPGA芯片的Jacinto 系列SoC 異構處理器

2020-06-02 15:09:59

HSA----CPU+GPU異構系統(tǒng)架構詳解

解析HSA----CPU+GPU異構系統(tǒng)架構

2021-02-03 07:07:34

TSC峰會回顧04 | 異構計算場景下構建可信執(zhí)行環(huán)境

。那么在異構計算場景下，如何構建可信執(zhí)行環(huán)境呢？分布式機密計算是一種思路，將CPU上的技術應用到其他的XPU上是另一種思路，但最關鍵的問題是怎么用。該問題在AI安全上非常明顯，AI模型都在GPU上

2023-04-19 15:20:32

Vicor高密度合封電源助力安徽人工智能大時代處理器實現(xiàn)更高可靠的性能

將于 2017 年 8 月在中國北京召開的開放數(shù)據(jù)中心峰會(ODCC)上推出　　Vicor 公司今日宣布推出適用于高性能、大電流 CPU/GPU/ASIC（“XPU”）處理器合封的模塊化電流倍增器

2017-09-08 10:24:56

【產(chǎn)品活動】阿里云GPU云服務器年付5折！阿里云異構計算助推行業(yè)發(fā)展！

摘要：阿里云GPU云服務器全力支持AI生態(tài)發(fā)展，進一步普惠開發(fā)者紅利，本周將會推出針對異構計算GPU實例GN5年付5折的優(yōu)惠活動，希望能夠打造良好的AI生態(tài)環(huán)境，幫助更多的人工智能企業(yè)以及項目順利

2017-12-26 11:22:09

【免費直播】AI芯片專家陳小柏博士，帶你解析AI算法及其芯片操作系統(tǒng)。

智慧化進程。人工智能芯片是人工智能發(fā)展的基石，是數(shù)據(jù)、算法和算力在各類場景應用落地的基礎依托?！盁o芯片不AI”已經(jīng)深入人心，成為業(yè)界共識。本次直播將述說AI芯片設計帶你解析AI算法及其芯片操作系統(tǒng)

2019-11-07 14:03:20

【免費直播】讓AI芯片擁有最強大腦—AI芯片的操作系統(tǒng)設計介紹.

2019-11-07 14:18:45

【開源硬件大賽】基于V851S芯片的AI運動相機方案設計原理

方案說明采用全志科技三核異構架的AI芯片V851S作為本項目的主控方案，內(nèi)置64M DDR與小體積便攜式的產(chǎn)品絕配。配套PMIC AXP2101作為電源管理。電池可以拆卸配置，不用為運動相機的續(xù)航

2022-12-11 18:08:23

一文詳解Ubuntu環(huán)境下AI圖像識別體驗

1、Ubuntu環(huán)境下AI圖像識別體驗　　CSK6 是聆思科技新一代的 AI 芯片 SoC 產(chǎn)品系列，采用多核異構架構，集成了 ARM Star MCU，HiFi4 DSP，以及聆思全新設計的 AI

2022-11-23 16:09:42

人工智能AI芯片到底怎么用

什么是人工智能（AI）芯片？AI芯片的主要用處有哪些？在AI任務中，AI芯片到底有多大優(yōu)勢？

2021-09-22 08:00:01

什么是異構多處理呢？

什么是異構多處理呢？為什么需要異構多處理系統(tǒng)

2021-02-26 06:59:37

什么是異構并行計算

先了解什么是異構并行計算同構計算是使用相同類型指令集和體系架構的計算單元組成系統(tǒng)的計算方式。而異構計算主要是指使用不同類型指令集和體系架構的計算單元組成系統(tǒng)的計算方式，常見的計算單元類別包括CPU

2021-07-19 08:27:56

北極雄芯開發(fā)的首款基于Chiplet異構集成的智能處理芯片“啟明930”

近日，北極雄芯分別在西安秦創(chuàng)原人工智能前沿科技成果發(fā)布會及北京韋豪創(chuàng)芯孵化器啟用儀式上同步發(fā)布了首個基于Chiplet架構的“啟明930”AI芯片。據(jù)介紹，該芯片中央控制芯粒采用RISC-V CPU

2023-02-21 13:58:08

華為如何進行全面轉(zhuǎn)型？

華為接下來的動作可能是這家公司在AI領域最大的投入：發(fā)布華為云數(shù)據(jù)中心AI芯片，并跟國際巨頭達成合作；推出類似TensorFlow、Caffe、PaddlePaddle的深度學習開源框架，同時推出跨

2019-09-11 11:51:49

華秋助力國產(chǎn)芯——全志V853多目異構視覺芯片了解下

件和無線互聯(lián)芯片設計廠商。在超高清視頻編解碼、高性能CPU/GPU/AI多核整合、先進工藝的高集成度、超低功耗、全棧集成平臺等方面提供具有市場突出競爭力的系統(tǒng)解決方案和貼心服務，業(yè)務體系涵蓋智能硬件

2022-11-04 15:04:29

嵌入式AI在linux芯片平臺上的部署方案分享

ONNX簡述ONNX是一種AI神經(jīng)網(wǎng)絡模型的通用中間文件保存方法(可以理解成AI世界的XML)，各種AI框架，Inference引擎，甚至OpenCV里面的dnn onnx相關的模塊都可以解析

2021-12-14 06:18:44

怎么克服嵌入式CPU的性能瓶頸？

芯片功耗解析芯片的傳輸延時克服嵌入式CPU性能瓶頸

2021-03-09 07:11:43

手把手教你設計人工智能芯片及系統(tǒng)--（全階設計教程+AI芯片FPGA實現(xiàn)+開發(fā)板）

`` 為什么發(fā)起AI芯片設計眾籌 ?1、傳統(tǒng)指令驅(qū)動的處理器（CPU和GPU）已經(jīng)無法支持數(shù)據(jù)驅(qū)動的AI技術，專用AI芯片已成為市場真實的強勁的需求，擁有AI芯片開發(fā)能力和經(jīng)驗的工程師將會受到產(chǎn)業(yè)

2019-07-19 11:54:01

探討AI芯片設計和開發(fā)的6個挑戰(zhàn)

AI實現(xiàn)的特點有哪些？AI芯片設計和開發(fā)面臨哪些挑戰(zhàn)？

2021-11-02 09:19:08

新思科技發(fā)布業(yè)界首款全棧式AI驅(qū)動型EDA解決方案Synopsys.ai

摘要：Synopsys.ai可為芯片設計提供AI驅(qū)動型解決方案，包含數(shù)字、模擬、驗證、測試和制造模塊。AI引擎可顯著提高設計效率和芯片質(zhì)量，同時降低成本?！びミ_（NVIDIA）、臺積公司（TSMC

2023-04-03 16:03:26

是否有計劃在NanoEdge AI Studio中全面支持STEVAL-PROTEUS1開發(fā)板？

是否有計劃在 NanoEdge AI Studio 中全面支持 STEVAL-PROTEUS1 開發(fā)板？目前只有 STEVAL-STWINKT1B 具有完全支持（帶數(shù)據(jù)記錄）。

2022-12-06 07:46:32

求一種基于Rockchip RV1109和RV1126的AI智能攝像頭開發(fā)方案

RV1109和RV1126芯片有哪些不同？求一種基于Rockchip RV1109和RV1126的AI智能攝像頭開發(fā)方案

2022-02-21 06:49:39

求書籍嵌入式linux系統(tǒng)開發(fā)全面解析

`嵌入式linux系統(tǒng)開發(fā)全面解析pdf`

2017-04-17 12:12:14

用嵌入式AI技術提升智能硬件應用能力

。 4H99人臉識別方案主控采用君正核異構跨界處理器X2000，其CPU內(nèi)核采用XBurst?2邏輯雙核 +XBurst?0的三核結構， XBurst?是北京君正完全自主知識產(chǎn) 權的32位RISC

2022-10-09 14:33:09

自動駕駛AI芯片現(xiàn)狀分析

自動駕駛AI芯片到位了么？

2020-12-04 06:13:55

萌新求助，求大神全面解析一下EMMC驅(qū)動

2021-10-18 09:25:09

藍牙單芯片的方案解析

藍牙單芯片方案

2021-01-06 07:17:04

請問模型推理只用到了kpu嗎？可以cpu，kpu，fft異構計算嗎？

請問模型推理只用到了kpu嗎？可以cpu，kpu，fft異構計算嗎？

2023-09-14 08:13:24

談一談對AI芯片軟硬件協(xié)同與AI編譯軟件棧的泛泛看法

1、軟硬件協(xié)同與AI編譯軟件棧介紹　　2個核心要點，都是錢砸出來的感悟?！　τ赟IMD為主的DSA，指令的圖靈完備決定了芯片的可編程性。例如某些算子不能使用NPU編程，還需要在另外一個cpu上編程

2022-11-16 15:24:21

超異構芯片TDA4內(nèi)核解析

1、超異構芯片TDA4內(nèi)核解析超異構芯片最近是比較火的一個名詞，其集中特性是將各類不同的芯片內(nèi)核進行融合，這種集成式芯片設計可以充分整合芯片資源，進一步提升數(shù)據(jù)計算效率。并且由于芯片在設計之初就打

2022-12-09 16:29:02

AD9361BBCZ高性能射頻收發(fā)器的全面解析

AD9361BBCZ高性能射頻收發(fā)器的全面解析摘要：本文將對AD9361BBCZ高性能射頻收發(fā)器的性能指標進行詳細解析，包括其工作頻率范圍、帶寬、功耗、集成度等方面。同時，還將介紹該芯片在5G、物

2024-02-16 18:03:46

AD9217BBPZ-10G高性能模數(shù)轉(zhuǎn)換器的全面解析

AD9217BBPZ-10G高性能模數(shù)轉(zhuǎn)換器的全面解析摘要：本文將對AD9217BBPZ-10G高性能模數(shù)轉(zhuǎn)換器的性能指標進行詳細解析，包括其采樣率、分辨率、功耗、集成度等方面。同時，還將介紹該芯片

2024-02-16 18:50:46

大陸車載信息通訊解決方案AutoLinQ全面解析

大陸車載信息通訊解決方案AutoLinQ全面解析 Telematics在中國的發(fā)展還是處于小荷才露尖尖角的狀態(tài)，但是在歐美國家已經(jīng)發(fā)展了差不多十年的時間，盡管成

2009-12-23 09:50:14

562

CPU內(nèi)核結構解析

CPU內(nèi)核結構解析 CPU內(nèi)核主要分為兩部分：運算器和控制器。　?。ㄒ唬?運算器　　1、算

2010-04-15 16:13:27

1495

#芯片 #AI 世界最強AI芯片H200性能大揭秘！

芯片AI

深圳市浮思特科技有限公司發(fā)布于 2023-11-15 15:54:37

全面解析：PCB設計接地問題精要

2016-12-15 18:39:07

基于CRE與ABS的異構蜂窩干擾協(xié)調(diào)方案_王祿生

2017-01-08 10:40:54

全面解析多點觸控技術

2017-01-14 12:30:41

全面解析5G WiFi無線連接

2017-01-12 22:15:17

帶你了解百度發(fā)布的XPU——AI云加速芯片細節(jié)

近日，在加州Hot Chips大會上，百度發(fā)布了XPU，這是一款256核、基于FPGA的云計算加速芯片，合作伙伴是賽思靈（Xilinx）。百度也在這次的大會上，透露了關于這款芯片的更多架構方面的細節(jié)。

2017-08-28 10:36:12

1243

嵌入式軟件行業(yè)針對異構多核芯片開發(fā)出首個全面解決方案及產(chǎn)品附加信息

Mentor Graphics Corporation 日前宣布推出嵌入式軟件行業(yè)針對異構多核芯片（SoC）開發(fā)的首個全面解決方案。異構架構即結合兩種或多種不同類型的微處理器或微控制器的架構。這種

2017-09-14 16:12:38

異構計算芯片的機遇與挑戰(zhàn)

異構計算的機遇與挑戰(zhàn) 異構計算是指不同類型的指令集和體系架構的計算單元組成的系統(tǒng)的計算方式，目前 CPU+GPU以及CPU+FPGA 都是最受業(yè)界關注的異構計算平臺。它最大的優(yōu)點是具有比傳統(tǒng)CPU

2017-09-27 10:22:47

基于FPGA異構加速的OCR識別技術解析

，2017年初，我們在騰訊云首發(fā)了國內(nèi)第一臺FPGA公有云服務器，我們將會逐步把基礎AI加速能力推出到公有云上。AI異構加速的戰(zhàn)場很大很精彩，為公司內(nèi)及云上業(yè)務提供最優(yōu)的解決方案是架平FPGA團隊持續(xù)努力的方向。

2017-12-14 05:32:44

2667

基于PKI和IBC的異構簽密方案

現(xiàn)有的基于傳統(tǒng)公鑰密碼體制（PKI，public key infrastructure）和基于身份的密碼體制（IBC，identity-based cryptosystem）之問的異構簽密方案都有

2018-01-08 16:04:49

當CPU碰上FPGA 異構計算又會發(fā)生什么樣的變化

傳統(tǒng)異構方案中，CPU將數(shù)據(jù)一次性發(fā)送給FPGA，處理完成后再交給CPU，加速設備與主機并不同時參與計算。與傳統(tǒng)方案不同，本設計采用了設備間流水處理的加速方案，即：將數(shù)據(jù)集進行了分組，各組數(shù)據(jù)在被

2018-07-06 09:06:00

2943

魏少軍：AI領域芯片已“炒作”過熱

芯片是實現(xiàn)AI實現(xiàn)智能的當然載體，“無芯片，不AI”。這也使得如今的芯片行業(yè)進入到一個高爆發(fā)和強競爭的階段，例如英偉達在分立式GPU產(chǎn)品上占有優(yōu)勢，產(chǎn)品廣泛應用于數(shù)據(jù)中心的人工智能訓練；AMD能夠

2018-03-13 13:59:59

3023

推動AI向終端邁進驍龍AI芯片延展前沿應用場景

的機器人能快速的識別色彩、理解文字和圖像。而為了推動AI在終端側(cè)的邁進，針對AI手機和AI終端的智慧需求，高通推出了更為契合并基于神經(jīng)網(wǎng)絡運算的AI Engine，將AI芯片的CPU、GPU、DSP組成一個異構AI平臺.

2018-08-03 11:52:00

482

高通拓展終端人工智能異構AI平臺為AI手機帶來AI引擎

高通的人工智能引擎將AI手機中驍龍AI芯片的CPU、GPU、DSP組成一個異構AI平臺，再與合作伙伴的應用形成協(xié)同，共同構建起來的一個AI業(yè)務生態(tài)。這一異構計算的解決方案為開發(fā)者和OEM廠商提供了在AI手機或其他邊緣終端上優(yōu)化AI用戶體驗的能力，為高端AI手機帶來前沿的終端側(cè)AI的頂級特性。

2018-07-20 14:44:00

971

AI芯片與其他芯片有什么區(qū)別？

所謂的AI芯片，一般是指針對AI算法的ASIC（專用芯片）。傳統(tǒng)的CPU、GPU都可以拿來執(zhí)行AI算法，但是速度慢，性能低，無法實際商用。

2018-07-25 14:58:51

33472

高通AI芯片異構計算滿足AI手機各類不同需求

，能夠利用芯片的異構計算能力來加強機器學習。第三代AI芯片驍龍845集成高通最新推出的人工智能引擎AI Engine，能夠?qū)崿F(xiàn)最頂尖的終端AI處理。

2018-07-27 14:28:02

912

AI芯片的架構和傳統(tǒng)芯片有什么不同？

所謂的AI芯片，一般是指針對AI算法的ASIC（專用芯片）。傳統(tǒng)的CPU、GPU都可以拿來執(zhí)行AI算法，但是速度慢，性能低，無法實際商用。

2018-08-01 10:34:57

10550

雄邁同軸模擬高清AI芯片28nm工藝XM350AI芯片解析

同軸模擬高清AI芯片XM350AI芯片集第三代ISP、AI加速單元、CPU等于一體，并支持多種相關接口。

2018-11-07 13:24:00

3630

拳打TPU，腳踢英特爾，亞馬遜自研CPU和AI云芯片曝光

關鍵詞：CPU , AI云芯片 , Graviton , Inferentia 文/文強、張乾、大明來源：新智元（ID：AI_era）【新智元導讀】本周，亞馬遜推出首款自研Arm架構云服務器

2018-12-06 17:47:01

269

AI到底是什么為什么需要了解AI AI的全面資料解析

越來越多的人關注和研究AI，那么AI到底是什么？我們今天就來全面的解析一下，AI是什么？人工智能（AI）是機器智能和計算機科學的一個分支，是一門研究機器智能和智能機器的新型的、綜合性的、具有強大生命力的邊緣學科。

2019-02-03 13:50:00

9073

基于三星14納米工藝的百度昆侖AI芯片將量產(chǎn)

這是三星電子和百度的首次半導體代工合作。百度昆侖AI芯片結合百度自主研發(fā)的神經(jīng)處理器架構XPU和三星14納米制造工藝，采用I-Cube封裝解決方案，可廣泛用于云計算和邊緣計算。

2019-12-19 14:11:23

2746

三星與百度合作生產(chǎn)AI芯片，代工服務擴展到數(shù)據(jù)中心

百度將和三星合作，明年開始生產(chǎn)AI芯片，該芯片被稱為昆侖，該芯片基于其先進的XPU（一種針對云，邊緣和AI的自主研發(fā)的神經(jīng)處理器架構）構建。

2019-12-19 14:16:56

2528

埃瓦科技正式發(fā)布3D視覺AI芯片——Ai3100

據(jù)麥姆斯咨詢報道，埃瓦科技正式發(fā)布3D視覺AI芯片——Ai3100，是埃瓦針對AI終端市場“追螢”系列的首款專用芯片。Ai3100基于異構架構，集成3D單目雙目結構光、ISP、HDR、NPU等專用引擎，提供高性能

2020-06-01 17:05:01

3391

Intel付得起xPU的巨額尾款嗎？

一波還未平息，一波再起，Intel繼續(xù)擴張其xPU陣營！上回，筆者說道Intel正在利用xPU+oneAPI的超異構計算的形式延續(xù)摩爾定律。所謂 xPU即為CPU+GPU+FPGA+其他加速器

2020-11-24 16:52:44

1933

異構計算或引發(fā)芯片巨頭割據(jù)戰(zhàn)

對英特爾來說，“CPU巨頭”的標簽已經(jīng)深入人心。不過，在最近兩個月，CPU在英特爾的關注度被軟件和獨立GPU搶了風頭。不知從何時起，“軟件為先”和“XPU”已經(jīng)成為英特爾新的流行詞。同樣，英偉

2020-12-24 09:12:18

1694

芯片巨頭們的“異構”大戰(zhàn)已經(jīng)開啟

2021-01-08 10:18:17

1641

異構文本數(shù)據(jù)轉(zhuǎn)換過程中解析XML文本的方法對比

對異構文本數(shù)據(jù)轉(zhuǎn)換過程中解析XML文本的DOM、SAX、JOM4J方法進行對比研究，以解析時間、內(nèi)存堆占用空間、CPU占用率為評價指標來判定4種解析方法的優(yōu)劣。該評價方法的優(yōu)勢在于當數(shù)據(jù)量或數(shù)據(jù)屬性

2021-03-25 11:12:04

CPU+XPU的超域架構全面發(fā)力智能時代

電子發(fā)燒友網(wǎng)報道（文/章鷹）11月3日，在深圳大中華喜來登酒店，來自安謀科技執(zhí)行董事長兼首席執(zhí)行官吳雄昂就最新萬物智能時代的算力挑戰(zhàn)，芯片+軟件耦合應對物聯(lián)網(wǎng)需求帶來的架構挑戰(zhàn)進行了詳細解讀

2021-11-08 09:43:50

2195

STM8S全解析之系列文章1---STM8S芯片項目需求與解決方案

STM8S全解析—系列文章1.STM8S芯片項目需求與解決方案提示：這里可以添加系列文章的所有文章的目錄，目錄需要自己手動添加例如：STM8S全解析—系列文章1.STM8S芯片與項目需求提示：寫完

2021-11-26 09:06:05

全面解析車規(guī)級芯片的分類

MCU，又稱單片機，-般只包含CPU這一個處理器單元;MCU=CPU+存儲+接口單元;而SoC是系統(tǒng)級芯片，- -般包含多個處理器單元;如SoC可為CPU+GPU+DSP+NPU+存儲+接口單元。

2022-08-10 09:59:26

1251

從服務器發(fā)展方向來分析CPU的發(fā)展趨勢

主流芯片廠商已開始全面布局：intel已擁有CPU、FPGA、IPU產(chǎn)品線，正加大投入GPU產(chǎn)品線，推出最新的Falcon Shores架構，打磨異構封裝技術；NvDIA則接連發(fā)布多芯片模組（MCM

2022-12-05 10:46:41

798

超異構芯片設計及工作原理解析

超異構芯片是具有高水平的系統(tǒng)集成，以實現(xiàn)先進汽車的可擴展性和更低成本的支持集中式 ECU。關鍵核心包括具有標量和矢量內(nèi)核的下一代 DSP，專用深度學習的NN計算核和傳統(tǒng)算法加速器。

2022-12-23 11:34:37

1102

昆侖芯2代AI芯片榮獲「2022年度AI生產(chǎn)力創(chuàng)新獎」

此次獲獎的昆侖芯2代AI芯片搭載新一代架構昆侖芯XPU-R，能夠滿足多樣的AI模型和場景需求，提供最優(yōu)的性能和能耗效率，并且給開發(fā)者提供靈活易用的編程模型。昆侖芯2代是國內(nèi)首款采用GDDR6顯存的通用AI芯片

2023-02-03 15:51:05

857

英特爾如何構建下一代超級計算芯片

該芯片制造商分享了即將推出的名為 Falcon Shores 的芯片的更多細節(jié)，該芯片最初被定為 XPU（統(tǒng)一的 CPU 和 GPU）。

2023-05-24 12:31:43

329

Chiplet加劇XPU之爭，英偉達為何遲遲不出手？

所謂XPU，可以理解為“多PU組合”，即在一個芯片中集成CPU、GPU和AI加速器等多項功能，以適應更廣闊的超級計算市場。在此之前，英特爾的Falcon Shores XPU混合搭配CPU

2023-06-15 14:42:44

1350

京微齊力采用Imagination AI加速器打造新型智能芯片

京微齊力的新型加速芯片是將FPGA、CPU、AI等多種異構計算單元集成在同一個芯片上，采用了領域自適應與邏輯可重構的計算模式，具有“軟件可編程、硬件可重構”的特性。

2023-07-12 09:56:49

442

ai芯片和cpu有啥區(qū)別？

ai芯片和cpu有啥區(qū)別？ AI芯片和CPU有什么區(qū)別？隨著人工智能技術在各行各業(yè)的廣泛應用，人們對于AI芯片與CPU的區(qū)別越來越感興趣。雖然它們都是計算機芯片，但它們在設計和應用方面有著很大

2023-08-08 18:00:45

4662

崛起中的‘芯’力量：解析中國CPU芯片企業(yè)的發(fā)展現(xiàn)狀

近年來，隨著全球科技界對半導體行業(yè)重視度的逐漸提升，國產(chǎn)產(chǎn)CPU芯片企業(yè)也開始嶄露頭角。從政府的大力支持到企業(yè)的不斷創(chuàng)新，國產(chǎn)已經(jīng)形成了一個逐漸成熟的半導體生態(tài)系統(tǒng)。本文將從多個方面對國產(chǎn)產(chǎn)CPU芯片企業(yè)的發(fā)展現(xiàn)狀進行全面評價。

2023-08-31 09:16:22

2692

CPU+xPU的異構方案解析 cpu和gpu有啥區(qū)別

CPU+xPU 的異構方案成為大算力場景標配，GPU為應用最廣泛的 AI 芯片。目前業(yè)內(nèi)廣泛認同的AI 芯片類型包括GPU、FPGA、NPU 等。由于 CPU 負責對計算機的硬件資源進行控制調(diào)配，也要負責操作系統(tǒng)的運行，在現(xiàn)代計算系統(tǒng)中仍是不可或缺的。

2023-09-03 11:47:31

1068