chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

賽靈思分享:智能引擎中所的AI引擎技術(shù)分析

454398 ? 來源:Xilinx技術(shù)社區(qū) ? 作者:Olivier Tremois ? 2020-10-11 11:14 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

作者:Olivier Tremois(AI 引擎工具市場營銷部門)和 Florent Werbrouck(賽靈思技術(shù)支持產(chǎn)品應(yīng)用工程師

Versal ACAP 簡介

Versal 自適應(yīng)計(jì)算加速平臺(tái) (ACAP) 是基于 TSMC 7nm FinFET 工藝技術(shù)構(gòu)建的最新一代賽靈思器件。它利用高帶寬片上網(wǎng)絡(luò) (NoC) 將代表處理器系統(tǒng) (PS) 的標(biāo)量引擎、代表可編程邏輯 (PL) 的自適應(yīng)引擎與智能引擎有機(jī)結(jié)合在一起。

本文將著重介紹智能引擎中所包含的 AI 引擎。

賽靈思 AI 引擎簡介

在部分賽靈思 Versal ACAP 中包含了 AI 引擎。這些 AI 引擎可排列組合為一組與內(nèi)存、數(shù)據(jù)流和級(jí)聯(lián)接口相連的二維AI 引擎拼塊陣列。在當(dāng)前 ACAP 器件(例如,VC1902 器件)上,此陣列最多可包含 400 個(gè)拼塊。此陣列中還包含AI 引擎接口(位于最后一行),以便于陣列中的其它器件(PS、PL 和 NoC)進(jìn)行交互。

AI 引擎接口包含PL 和 NoC 接口拼塊以及配置拼塊。從 PL 到 AI 引擎陣列的連接是使用 AXI4-Stream 接口通過 PL 和 NoC 接口拼塊來實(shí)現(xiàn)的。從 NoC 到 AI 引擎陣列的連接是使用 AXI4 存儲(chǔ)器映射接口通過 NoC 接口拼塊來實(shí)現(xiàn)的。

有趣的是,從中可以看到,只有在 NoC 到 AI 引擎拼塊之間才存在 AXI4 存儲(chǔ)器映射直接通信通道,在 AI 引擎拼塊到 NoC 之間卻并不存在。

注:PL 和 NoC 接口拼塊的精確數(shù)量因器件而異。《Versal 架構(gòu)和產(chǎn)品數(shù)據(jù)手冊(cè):簡介》(DS950) 中羅列了 AI 引擎陣列的大小。
https://china.xilinx.com/support/documentation/data_sheets/ds950-versal-...

AI 引擎拼塊架構(gòu)

現(xiàn)在,我們來詳細(xì)了解下此陣列,看看 AI 引擎拼塊的內(nèi)部。

每個(gè) AI 引擎拼塊都包含:

  • 1 個(gè)拼塊互連模塊,用于處理 AXI4-Stream 和存儲(chǔ)器映射 AXI4 輸入/輸出
  • 1 個(gè)存儲(chǔ)器模塊,其中包含 32 KB 數(shù)據(jù)內(nèi)存,細(xì)分為 8 個(gè)內(nèi)存 bank、1 個(gè)內(nèi)存接口、DMA 和各種鎖定。
  • 1 個(gè) AI 引擎

AI 引擎可訪問全部 4 個(gè)方向中的多達(dá) 4 個(gè)內(nèi)存模塊(作為 1 個(gè)連續(xù)存儲(chǔ)器塊)。這意味著除了拼塊本地的內(nèi)存,AI 引擎還可以訪問 3 個(gè)相鄰拼塊的本地內(nèi)存(除非拼塊位于陣列邊緣)。

  • 北側(cè)內(nèi)存模塊
  • 南側(cè)內(nèi)存模塊
  • 東側(cè)或西側(cè)內(nèi)存模塊(取決于 AI 引擎和內(nèi)存模塊所在的行和相對(duì)布局)。

AI 引擎架構(gòu)

AI 引擎屬于高度優(yōu)化的處理器,包含下列主要特色:

  • 32 位標(biāo)量 RISC 處理器(名為 Scalar Unit)
  • 1 個(gè) 512b SIMD 矢量單元(可提供矢量定點(diǎn)/整數(shù)單元)和 1 個(gè)單精度浮點(diǎn) (SPFP) 矢量單元
  • 3 個(gè)地址生成器單元 (AGU)
  • 超長指令字 (VLIW) 功能
  • 3 個(gè)數(shù)據(jù)內(nèi)存端口(2 個(gè)負(fù)載端口,1 個(gè)存儲(chǔ)端口)
  • 直接流傳輸接口(2 個(gè)輸入流,2 個(gè)輸出流)

AI 引擎陣列編程

AI 引擎拼塊按 10 或 100 為單位組成陣列。創(chuàng)建嵌入多項(xiàng)指令的單一程序用于指定并行性將是一項(xiàng)冗長且近乎不可能的任務(wù)。因此 AI 引擎陣列模型編程與 Kahn 處理網(wǎng)絡(luò) (Kahn Process Networks) 之間的共通之處在于自主計(jì)算進(jìn)程通過通信邊緣實(shí)現(xiàn)彼此互連,從而生成處理網(wǎng)絡(luò)。

(請(qǐng)參閱 https://perso.ensta-paris.fr/~chapoutot/various/kahn_networks.pdf )

在 AI 引擎框架中,Graph 邊緣是緩存和數(shù)據(jù)流,而計(jì)算進(jìn)程則被稱為內(nèi)核。在Graph中,內(nèi)核經(jīng)過例化,彼此相連并連接到設(shè)計(jì)其余部分(NoC 或 PL)。

編程流程分為 2 個(gè)階段:

單內(nèi)核編程:

內(nèi)核用于描述特定計(jì)算進(jìn)程。每個(gè)內(nèi)核都將在單一 AI 引擎拼塊上運(yùn)行。但請(qǐng)注意,多個(gè)內(nèi)核可在同一個(gè) AI 引擎拼塊上運(yùn)行,并共享處理時(shí)間。任意 C/C++ 代碼均可用于對(duì) AI 引擎進(jìn)行編程。標(biāo)量處理器將處理大部分代碼。如果您的目標(biāo)是設(shè)計(jì)高性能內(nèi)核,那么應(yīng)考慮采用矢量處理器,它使用稱為內(nèi)部函數(shù)的專用函數(shù)。這些函數(shù)專用于 AI 引擎的矢量處理器,支持您從 AI 引擎中發(fā)掘出巨大的處理性能。賽靈思將提供預(yù)構(gòu)建內(nèi)核(包含在庫內(nèi)),以供用戶在其定制 Graph 中使用。

Graph 編程:

賽靈思將提供 C++ 框架以從內(nèi)核創(chuàng)建Graph。此框架包含 Graph 節(jié)點(diǎn)和連接聲明。這些節(jié)點(diǎn)可包含在 AI 引擎陣列內(nèi)或可編程邏輯(HLS 內(nèi)核)中。為了完全掌握內(nèi)核位置,將有一系列方法可用來約束布局(內(nèi)核、緩存、系統(tǒng)內(nèi)存等)。Graph 將例化并使用緩存和數(shù)據(jù)流將內(nèi)核連接在一起。它還將描述 AI 引擎陣列與其它ACAP 器件(PL 或 DDR)之間的雙向往來數(shù)據(jù)傳輸。

賽靈思將提供預(yù)構(gòu)建 Graph(包含在庫內(nèi)),以供用戶在其應(yīng)用中使用。

在運(yùn)行時(shí)以及仿真期間,AI 引擎應(yīng)用由 PS 進(jìn)行控制。

賽靈思將根據(jù)應(yīng)用的操作系統(tǒng)提供多種 API,如下所述。

  • Xilinx Run Time (XRT) 和 OpenCL,適用于 Linux 應(yīng)用
  • 裸機(jī)驅(qū)動(dòng)程序

編輯:hfy

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 賽靈思
    +關(guān)注

    關(guān)注

    33

    文章

    1797

    瀏覽量

    132366
  • AI
    AI
    +關(guān)注

    關(guān)注

    88

    文章

    35167

    瀏覽量

    280105
  • 可編程邏輯
    +關(guān)注

    關(guān)注

    7

    文章

    526

    瀏覽量

    44768
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    信而泰×DeepSeek:AI推理引擎驅(qū)動(dòng)網(wǎng)絡(luò)智能診斷邁向 “自愈”時(shí)代

    DeepSeek-R1:強(qiáng)大的AI推理引擎底座DeepSeek是由杭州深度求索人工智能基礎(chǔ)技術(shù)研究有限公司開發(fā)的新一代AI大模型。其核心優(yōu)勢
    發(fā)表于 07-16 15:29

    涂鴉智能重磅發(fā)布四大AIoT技術(shù)引擎,賦能開發(fā)者以AI重構(gòu)物理世界

    正加快推動(dòng)AIoT技術(shù)普惠化進(jìn)程?,F(xiàn)場,涂鴉分享了AIAgent開發(fā)平臺(tái),并重磅發(fā)布了Tuya.AI、TuyaOpen和海德薇(HEDV)等技術(shù)引擎,賦能開發(fā)者全
    的頭像 發(fā)表于 05-08 19:07 ?310次閱讀
    涂鴉<b class='flag-5'>智能</b>重磅發(fā)布四大AIoT<b class='flag-5'>技術(shù)</b><b class='flag-5'>引擎</b>,賦能開發(fā)者以<b class='flag-5'>AI</b>重構(gòu)物理世界

    移遠(yuǎn)通信攜手火山引擎:加速AI大模型技術(shù)應(yīng)用,共繪AIoT智能未來新藍(lán)圖

    4月2日,移遠(yuǎn)通信受邀參加火山引擎聯(lián)合英特爾在深圳舉辦的“AIoT智變浪潮”技術(shù)沙龍?;顒?dòng)以“大模型+音視頻,如何驅(qū)動(dòng)AI硬件體驗(yàn)革新”為主題,眾多行業(yè)大咖齊聚一堂,圍繞硬件智能升級(jí)面
    的頭像 發(fā)表于 04-02 19:02 ?712次閱讀
    移遠(yuǎn)通信攜手火山<b class='flag-5'>引擎</b>:加速<b class='flag-5'>AI</b>大模型<b class='flag-5'>技術(shù)</b>應(yīng)用,共繪AIoT<b class='flag-5'>智能</b>未來新藍(lán)圖

    ×火山引擎 | 高精度同步時(shí)鐘助力字節(jié)跳動(dòng)華東地區(qū)首個(gè)算力中心落地

    同步時(shí)鐘全方位賦能火山引擎長三角算力中心,助力字節(jié)跳動(dòng)火山引擎打造“云上新宇宙”。
    的頭像 發(fā)表于 03-31 14:44 ?514次閱讀
    <b class='flag-5'>賽</b><b class='flag-5'>思</b>×火山<b class='flag-5'>引擎</b> | 高精度同步時(shí)鐘助力字節(jié)跳動(dòng)華東地區(qū)首個(gè)算力中心落地

    ×字節(jié)跳動(dòng) 高精度同步時(shí)鐘助力火山引擎打造“云上新宇宙”

    摘要: 同步時(shí)鐘將對(duì)火山引擎長三角算力中心進(jìn)行從基礎(chǔ)設(shè)施到業(yè)務(wù)引擎的全方位賦能,助力字節(jié)跳動(dòng)旗下火山引擎打造“云上新宇宙”。 火山
    的頭像 發(fā)表于 03-28 09:11 ?389次閱讀
    <b class='flag-5'>賽</b><b class='flag-5'>思</b>×字節(jié)跳動(dòng)  高精度同步時(shí)鐘助力火山<b class='flag-5'>引擎</b>打造“云上新宇宙”

    融合30萬項(xiàng)專利,“OptoChat AI引擎引爆萬億光子AI市場

    ? 電子發(fā)燒友網(wǎng)報(bào)道(文/吳子鵬) 近日,南京江北新區(qū)企業(yè) —— 南京南智先進(jìn)光電集成技術(shù)研究院有限公司,聯(lián)合南京知滿科技等合作伙伴,成功開發(fā)出國內(nèi)首個(gè)光子 AI 智能引擎 “Opto
    的頭像 發(fā)表于 03-09 04:38 ?1193次閱讀
    融合30萬項(xiàng)專利,“OptoChat <b class='flag-5'>AI</b>”<b class='flag-5'>引擎</b>引爆萬億光子<b class='flag-5'>AI</b>市場

    CSK6大模型語音開發(fā)板接入DeepSeek資料匯總(包含深度求索/火山引擎/硅基流動(dòng)華為昇騰滿血版)

    本帖最后由 jf_40317719 于 2025-3-6 21:20 編輯 近期也有不少開發(fā)者想把自己的智能硬件接入DeepSeek大模型,本篇就以聆CSK6大模型開發(fā)板接入DeepSeek
    發(fā)表于 03-06 17:02

    明遠(yuǎn)智睿SD2351核心板首發(fā):四核A35+硬核AI引擎,賦能工業(yè)AIoT

    ARM Cortex-A35架構(gòu),主頻高達(dá)1.5GHz,集成智能視頻引擎(IVE)與智能處理單元(IPU),支持多模態(tài)AI分析與實(shí)時(shí)視頻處理
    發(fā)表于 02-20 14:11

    騰訊混元3D AI創(chuàng)作引擎正式發(fā)布

    近日,騰訊公司宣布其自主研發(fā)的混元3D AI創(chuàng)作引擎已正式上線。這一創(chuàng)新性的創(chuàng)作工具將為用戶帶來前所未有的3D內(nèi)容創(chuàng)作體驗(yàn),標(biāo)志著騰訊在AI技術(shù)領(lǐng)域的又一重大突破。 混元3D
    的頭像 發(fā)表于 01-23 10:33 ?599次閱讀

    什么是AI查詢引擎

    AI 查詢引擎可高效處理、存儲(chǔ)和檢索大量數(shù)據(jù),以增強(qiáng)生成式 AI 模型的輸入。
    的頭像 發(fā)表于 01-10 10:00 ?1482次閱讀

    低溫失效的原因,有沒有別的方法或者一些見解?

    低溫失效的原因,有沒有別的方法或者一些見解。就是芯片工作溫度在100°--40°區(qū)間,然后呢我們到了0°以下就不工作了,然后在低溫的情況下監(jiān)測了電流和電壓都正常,頻率也都正常,頻率不是FPGA的頻率是晶振的頻率,焊接的話七
    發(fā)表于 12-30 16:28

    中科創(chuàng)達(dá)攜手火山引擎開啟AI智能座艙新體驗(yàn)

    12月18日至19日,"2024火山引擎FORCE原動(dòng)力大會(huì)·冬"在上海隆重召開。中科創(chuàng)達(dá)作為火山引擎的重要生態(tài)合作伙伴受邀參與此次盛會(huì),并在會(huì)上展示了與火山引擎共創(chuàng)的端云結(jié)合 AI
    的頭像 發(fā)表于 12-19 15:45 ?833次閱讀

    使用 AMD Versal AI 引擎釋放 DSP 計(jì)算的潛力

    “Versal AI 引擎可以在降低功耗預(yù)算的情況下提高 DSP 計(jì)算密度,”高級(jí)產(chǎn)品營銷經(jīng)理 Udayan Sinha 表示。這種效率使 Versal AI 引擎能夠在嚴(yán)格的功耗預(yù)算
    的頭像 發(fā)表于 11-29 14:07 ?1258次閱讀

    使用AMD Versal AI引擎加速高性能DSP應(yīng)用

    AMD Versal AI 引擎使您能夠擴(kuò)展數(shù)字信號(hào)處理( DSP )算力與面向未來的設(shè)計(jì),從而適應(yīng)當(dāng)前和下一代計(jì)算密集型 DSP 應(yīng)用。借助 Versal AI 引擎,客戶能以更低的
    的頭像 發(fā)表于 11-20 16:35 ?935次閱讀

    AI引擎機(jī)器學(xué)習(xí)陣列指南

    AMD Versal AI Core 系列和 Versal AI Edge 系列旨在憑借 AI 引擎機(jī)器學(xué)習(xí) ( ML ) 架構(gòu)來提供突破性的 AI
    的頭像 發(fā)表于 09-18 09:16 ?826次閱讀
    <b class='flag-5'>AI</b><b class='flag-5'>引擎</b>機(jī)器學(xué)習(xí)陣列指南