chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

Kria K26 SOM性能解決方案的對比分析

YCqV_FPGA_EETre ? 來源:FPGA開發(fā)圈 ? 作者:FPGA開發(fā)圈 ? 2021-07-02 14:13 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

賽靈思的研究結(jié)果表明,K26 SOM 提供了比英偉達 Jetson Nano 高出大約 3 倍的性能。此外,它的單位功耗性能較之英偉達 Jetson TX2 提升了 2 倍。對于 SSD MobileNet-v1 這樣的網(wǎng)絡(luò),K26 SOM 的低時延、高性能深度學習處理單元 (DPU)提供了比 Nano 高出 4 倍甚至更高的性能。

01

與未來兼容的 Kria K26 SOM

智能應(yīng)用除了要求亞微秒級的時延,還需要具備私密性、低功耗、安全性和低成本。以 Zynq MPSoC 架構(gòu)為基礎(chǔ),Kria K26 SOM 提供了業(yè)界一流的單位功耗性能和更低的總體擁有成本,使之成為邊緣設(shè)備的理想選擇。

原始計算能力

就在邊緣設(shè)備上部署解決方案而言,硬件必須擁有充足的算力,才能處理先進 ML 算法工作負載。我們可以使用各種深度學習處理單元 (DPU) 配置對 Kria K26 SOM 進行配置,還能根據(jù)性能要求,將最適用的配置集成到設(shè)計內(nèi)。

支持更低精度的數(shù)據(jù)類型

深度學習算法正在以極快的速度演進發(fā)展,各種更低精度的數(shù)據(jù)類型和定制數(shù)據(jù)正在進入使用。傳統(tǒng)的 GPU 廠商已無法滿足當前的市場需求,而 Kria K26 SOM 能夠支持全系列數(shù)據(jù)類型精度,如 PF32、INT8、二進制和其他定制數(shù)據(jù)類型。

運算的能耗成本

低時延與低功耗

為了改善軟件可編程能力,GPU 架構(gòu)需要頻繁訪問外部 DDR。這種做法非常低效,有時候會對高帶寬設(shè)計要求構(gòu)成瓶頸。相反,Zynq MPSoC 架構(gòu)具有高能效,它的可重配置能

力便于開發(fā)者設(shè)計的應(yīng)用減少或不必訪問外部存儲器。這不僅有助于減少應(yīng)用的總功耗,也通過降低端到端時延改善了響應(yīng)能力。

典型 GPU 與 Zynq MPSoC 架構(gòu)

靈活性

與數(shù)據(jù)流固定的 GPU 不同,賽靈思硬件提供了靈活性用來專門地重新配置數(shù)據(jù)路徑,從而實現(xiàn)最大吞吐量并降低時延。此外,可編程的數(shù)據(jù)路徑也降低了對批處理的需求,而批處理是 GPU 的一個重大不足,需要在降低時延或提高吞吐量之間做出權(quán)衡取舍。Kria SOM 靈活的架構(gòu)已在稀疏網(wǎng)絡(luò)中展示出巨大潛力。

02

與英偉達 Jetson 性能比較

深度學習模型性能比較

根據(jù)測試數(shù)據(jù),所有模型在 K26 SOM 上的性能數(shù)值均優(yōu)于英偉達 Jetson Nano。而且對于 SSD Mobilenet-V1 等部分模型,吞吐量則為 Jetson Nano 的四倍以上,為 Jetson Tx2 的兩倍左右,從下表可以很容易地看到顯著的吞吐量提升。

FPS(時延優(yōu)化)

功耗測量

邊緣設(shè)備提供最佳性能這點非常重要,但同時必須降低能耗。賽靈思測量了英偉達和賽靈思 SOM 模塊在執(zhí)行具體模型時發(fā)生的峰值功率,結(jié)果很明顯,K26 SOM 優(yōu)于 Jetson Nano

3.5 倍,優(yōu)于 Jetson TX2 2.4 倍。

FPS/瓦

實際應(yīng)用性能比較

為了分析實際用例,我們選擇了一種準確檢測和識別車輛牌照的基于機器學習的應(yīng)用。將 Uncanny Vision 行業(yè)領(lǐng)先的 ANPR 算法部署在 Kria SOM 上后,與英偉達用 Deepstream-SDK 完成的“車牌識別”的公開數(shù)據(jù)進行比較,結(jié)果說明,Uncanny Vision 的 ANPR 流水線在針對 KV260 入門套件進行優(yōu)化后,實現(xiàn)了超過 33fps 的吞吐量,顯著優(yōu)于英偉達基準測試中 Jetson Nano 的 8pfs 和 Jetson Tx2 的 23fps。這種前所未有的性能水平為 ANPR 集成商和 OEM 廠商提供了優(yōu)于競爭對手的開發(fā)靈活性。

實際應(yīng)用測試顯示,K26 SOM 不僅在標準性能比較中表現(xiàn)極其優(yōu)異,并且在為開發(fā)者提供加速整體 AI 和視覺流水線所需的原始性能時,效率也更高。通過對比,在標準的基準測試領(lǐng)域之外,競爭解決方案傾向于提供較低效率水平,而且功耗較高。

文章出處:【微信公眾號:FPGA開發(fā)圈】

責任編輯:gt

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 賽靈思
    +關(guān)注

    關(guān)注

    33

    文章

    1797

    瀏覽量

    133154
  • gpu
    gpu
    +關(guān)注

    關(guān)注

    28

    文章

    5100

    瀏覽量

    134476
  • 英偉達
    +關(guān)注

    關(guān)注

    23

    文章

    4041

    瀏覽量

    97689

原文標題:白皮書 | Kria K26:邊緣端視覺 AI 理想平臺

文章出處:【微信號:FPGA-EETrend,微信公眾號:FPGA開發(fā)圈】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    無源探頭與高壓探頭技術(shù)對比分析

    本文對比分析了無源探頭與高壓探頭的技術(shù)原理、性能參數(shù)及應(yīng)用場景,為選擇合適探頭提供參考。
    的頭像 發(fā)表于 11-30 15:47 ?371次閱讀

    傳統(tǒng)普通掃碼槍與RFID掃描槍對比分析

    本文深入對比傳統(tǒng)普通掃碼槍與RFID掃描槍的核心差異,從成本結(jié)構(gòu)、使用場景到技術(shù)特點進行全面分析,幫助企業(yè)選擇最適合的數(shù)據(jù)采集解決方案
    的頭像 發(fā)表于 11-19 11:03 ?991次閱讀
    傳統(tǒng)普通掃碼槍與RFID掃描槍<b class='flag-5'>對比分析</b>

    AMD Kria KV260視覺AI入門套件更新升級

    各種軟件工具與加速應(yīng)用,適合各種專業(yè)水平的開發(fā)人員。這款開箱即用的套件能極大助力希望利用量產(chǎn)版 Kria K26 SOM 加速產(chǎn)品上市并實現(xiàn)批量部署的客戶。
    的頭像 發(fā)表于 07-18 09:50 ?718次閱讀

    TaskPool和Worker的對比分析

    ,并提高系統(tǒng)的整體性能。 本文將從實現(xiàn)特點和適用場景兩個方面來進行TaskPool與Worker的比較。 實現(xiàn)特點對比 表1 TaskPool和Worker的實現(xiàn)特點對比 實現(xiàn)
    發(fā)表于 06-18 06:43

    國內(nèi)外電機結(jié)構(gòu) 工藝對比分析

    純分享帖,需要者可點擊附件免費獲取完整資料~~~*附件:國內(nèi)外電機結(jié)構(gòu) 工藝對比分析.pdf【免責聲明】本文系網(wǎng)絡(luò)轉(zhuǎn)載,版權(quán)歸原作者所有。本文所用視頻、圖片、文字如涉及作品版權(quán)問題,請第一時間告知,刪除內(nèi)容!
    發(fā)表于 05-29 14:06

    主流汽車電子SoC芯片對比分析

    主流汽車電子SoC芯片對比分析 隨著汽車智能化、電動化趨勢加速,系統(tǒng)級芯片(SoC)已成為汽車電子核心硬件。本文從技術(shù)參數(shù)、市場定位、應(yīng)用場景及國產(chǎn)化進程等維度,對主流汽車電子SoC芯片進行對比分析
    的頭像 發(fā)表于 05-23 15:33 ?4791次閱讀

    Made with KiCad(126):Antmicro OV5640 雙攝像頭子板

    的 Jetson Orin 底板 支持 AMD-Xilinx KRIA K26 模塊化系統(tǒng)的 Kria K26 Devboard 支持 Google Coral 模塊化系統(tǒng)的 Goo
    發(fā)表于 05-12 18:13

    Variscite提供ISO 13485認證SoM解決方案

    Variscite是全球知名的系統(tǒng)模塊 (SoM) 供應(yīng)商,近二十年來專注于先進嵌入式解決方案的研發(fā)。作為白金合作伙伴,Variscite與恩智浦建立了穩(wěn)固而持久的合作關(guān)系,憑借恩智浦先進的處理器,提供可擴展的高性能
    的頭像 發(fā)表于 05-12 15:11 ?1222次閱讀

    機器人開發(fā)套件 Kria KR260

    機器人的潛力 用戶指南 產(chǎn)品簡介 Kria KR260機器人入門套件包括載卡、Kria K26 SOM和散熱解決方案。該
    的頭像 發(fā)表于 04-11 13:15 ?1407次閱讀
    機器人開發(fā)套件 <b class='flag-5'>Kria</b> KR260

    廣和通攜手阿里云推出隨身智能解決方案

    2月,廣和通與全球領(lǐng)先的云解決方案提供商阿里云達成合作:廣和通AI模組及解決方案,基于阿里云通義千問大模型,推出“隨身智能解決方案”,賦能消費電子行業(yè)。
    的頭像 發(fā)表于 02-25 16:04 ?878次閱讀

    多頻段白色蝴蝶天線:通信領(lǐng)域的高性能解決方案

    深圳安騰納天線|多頻段白色蝴蝶天線:通信領(lǐng)域的高性能解決方案
    的頭像 發(fā)表于 02-21 09:07 ?797次閱讀

    集特海光3350處理器工業(yè)主板GM9-5602:為工業(yè)應(yīng)用打造的高性能解決方案

    集特海光3350處理器工業(yè)主板GM9-5602:為工業(yè)應(yīng)用打造的高性能解決方案
    的頭像 發(fā)表于 02-20 17:29 ?1530次閱讀

    半導體激光器和光纖激光器的對比分析

    半導體激光器和光纖激光器是現(xiàn)代激光技術(shù)中的兩種重要類型,它們在結(jié)構(gòu)、工作原理、性能及應(yīng)用領(lǐng)域等方面有著顯著的區(qū)別。本文將從增益介質(zhì)、發(fā)光機理、散熱性能、輸出特性及應(yīng)用領(lǐng)域等多個方面,對這兩種激光器進行詳細的對比分析
    的頭像 發(fā)表于 02-03 14:18 ?2381次閱讀

    鴻蒙原生頁面高性能解決方案上線OpenHarmony社區(qū) 助力打造高性能原生應(yīng)用

    隨著HarmonyOS NEXT的正式推出,鴻蒙原生應(yīng)用開發(fā)熱度高漲,數(shù)量激增。但在三方應(yīng)用鴻蒙化進程中,性能問題頻出。為此,HarmonyOS NEXT推出了一整套原生頁面高性能解決方案,包括
    發(fā)表于 01-02 18:00

    TNC連接器對比分析:與其他射頻連接器的性能對決

    德索工程師說道在射頻連接器領(lǐng)域,TNC連接器以其卓越的性能和廣泛的應(yīng)用而著稱。以下是TNC連接器與其他射頻連接器的性能對比分析: TNC連接器vs SMA連接器 頻率范圍:TNC連接器的工作頻率
    的頭像 發(fā)表于 12-17 10:58 ?1572次閱讀
    TNC連接器<b class='flag-5'>對比分析</b>:與其他射頻連接器的<b class='flag-5'>性能</b>對決