chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

如何設計更智能的Edge AI

星星科技指導員 ? 來源:嵌入式計算設計 ? 作者:Tony King-Smith ? 2022-07-10 11:30 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

作為一名擁有 40 多年半導體業(yè)務研發(fā)總監(jiān)和 CMO 經(jīng)驗的工程師,我認為我自己和我的同行是合乎邏輯的。然而,我們當中有多少人可以誠實地說我們沒有被諸如“我的小部件比你的快?”這樣的說法所誘惑。恐怕這只是人性,尤其是當我們對你的專業(yè)知識沒有信心來調查這些說法時。

問題始終是一個定義:我如何定義“更快”或“更低功率”或“更便宜”?這是基準試圖解決的問題——它是關于具有一致的上下文和外部標準,以確保您將同類與同類進行比較。任何使用基準測試的人都非常清楚這一點(aiMotive 誕生于一家領先的 GPU 基準測試公司)。

在嘗試比較汽車 AI 應用的硬件平臺時,解決這種轟炸式索賠的需求從未像現(xiàn)在這樣緊迫。

10 TOPS 什么時候不是 10 TOPS?

無論是否有專用的 NPU,大多數(shù) SoC 都將其執(zhí)行 NN 工作負載的能力稱為 TOPS:每秒 Tera 操作。這只是 NPU(或整個 SoC)原則上每秒可以執(zhí)行的算術運算總數(shù),無論全部集中在專用 NPU 中還是分布在多個計算引擎中,例如 GPU、CPU 矢量協(xié)處理器、或其他加速器。

但是,沒有任何硬件執(zhí)行引擎能以 100% 的效率執(zhí)行任何工作負載的各個方面。對于神經(jīng)網(wǎng)絡推理,某些層(例如池化或激活)在數(shù)學上與卷積非常不同。在卷積本身(或其他層,如池化)可以開始之前,數(shù)據(jù)必須重新排列或從一個地方移動到另一個地方。其他時候,NPU 可能需要等待來自控制它的主機 CPU 的新指令或數(shù)據(jù),每個層甚至每個數(shù)據(jù)塊。這些都導致完成的計算更少,從而限制了理論上的最大容量。

硬件利用率——不是它看起來的樣子

許多 NPU 供應商會引用硬件利用率來表明他們的 NPU 執(zhí)行給定 NN 工作負載的情況。這基本上是說,“這就是我的 NPU 的理論容量有多少被用于執(zhí)行 NN 工作負載。” 當然,這告訴我我需要知道什么。

不幸的是沒有。硬件利用率的問題是定義之一:數(shù)量完全取決于 NPU 供應商選擇如何定義它。事實上,硬件利用率和 TOPS 的問題在于它們只告訴你硬件引擎理論上能夠實現(xiàn)什么,而不是它實現(xiàn)的程度。

這可能會導致一些誤導性信息。下面的圖 1 顯示了我們在額定 4 TOPS 的 aiWare3P NPU 與另一個額定為 8 TOPS 的知名 NPU 之間進行的比較。

poYBAGLKR_eAck4HAACgiX1heSI601.png

圖 1:兩個汽車推理 NPU 的利用率與效率比較

對于兩個不同的知名基準,競爭對手 X NPU 聲稱 8 TOPS 容量,而 aiWare3P 的 4 TOPS。這應該意味著它將提供大約 2 倍于 aiWare3P 的 fps 性能。然而,實際上,情況正好相反:aiWare3P 的性能提高了 2 到 5 倍,盡管它只是聲稱的 TOPS 的一半!

結論:TOPS 是衡量 AI 硬件能力的一種非常糟糕的方法;硬件利用率幾乎與 TOPS 一樣具有誤導性。

NPU 效率和自主性:優(yōu)化 PPA 的關鍵

這就是為什么我認為您必須根據(jù)執(zhí)行一組代表性工作負載時的效率而不是原始理論硬件容量來評估 NPU 能力。效率定義為為一幀執(zhí)行特定 CNN 需要多少操作,占聲稱的 TOPS 總數(shù)的百分比。該數(shù)字僅基于定義任何 CNN 的基礎數(shù)學算法計算得出,無論 NPU 實際如何評估它。它比較了實際與聲稱的性能,這才是真正重要的。

展示出高效率的 NPU 意味著它將充分利用用于實現(xiàn)它的每平方毫米硅片,這意味著更低的芯片成本和更低的功耗。效率可為汽車 SoC 或 ASIC 提供最佳 PPA(性能、功率和面積)。

NPU 的自治性是另一個重要因素。NPU 在主機 CPU 上放置多少 CPU 負載才能達到最高性能?這與內存子系統(tǒng)有什么關系?NPU 必須被視為任何 SoC 或 ASIC 中的大塊——它對芯片和子系統(tǒng)其余部分的影響不容忽視。

結論

在設計任何 SoC 或 ASIC 汽車時,AI 工程師必須專注于構建能夠可靠執(zhí)行其算法的生產(chǎn)平臺,同時實現(xiàn)卓越的 PPA:最低功耗、最低成本、更高性能。他們還必須在設計周期的早期就選擇硬件平臺,通常是在開發(fā)最終算法之前。

效率是實現(xiàn)這一目標的最佳方式;TOPS 和硬件利用率都不是好的衡量標準。如果要滿足苛刻的生產(chǎn)目標,評估 NPU 的自主性也至關重要。

審核編輯:郭婷

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權轉載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • cpu
    cpu
    +關注

    關注

    68

    文章

    11080

    瀏覽量

    217127
  • soc
    soc
    +關注

    關注

    38

    文章

    4392

    瀏覽量

    222811
  • AI
    AI
    +關注

    關注

    88

    文章

    35164

    瀏覽量

    280057
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    2.0.0版本的ST Edge AI Core在linux平臺上可以把量化后的onnx模型轉換為.nb,但是運行報錯,缺少文件,為什么?

    2.0.0版本的ST Edge AI Core工具在linux平臺上應該是可以把量化后的onnx模型轉換為.nb,但是運行報錯,缺少文件。
    發(fā)表于 06-17 06:29

    AMD第二代Versal AI Edge和Versal Prime系列加速量產(chǎn) 為嵌入式系統(tǒng)實現(xiàn)單芯片智能

    我們推出了 AMD 第二代 Versal AI Edge 系列和第二代 Versal Prime 系列,這兩款產(chǎn)品是對 Versal 產(chǎn)品組合的擴展,可為嵌入式系統(tǒng)實現(xiàn)單芯片智能。
    的頭像 發(fā)表于 06-11 09:59 ?896次閱讀

    2025研華嵌入式設計論壇上海站:聚焦Edge Computing & Edge AI,共探技術創(chuàng)新與生態(tài)融合

    Computing與Edge AI領域的最新技術進展、創(chuàng)新應用及生態(tài)構建。 ? 一、引領前沿技術,洞見未來趨勢 論壇在研華科技嵌入式物聯(lián)網(wǎng)事業(yè)群(中國)總經(jīng)理許杰弘先生的致辭中拉開序幕。他以“邊緣智能聚勢未來,生態(tài)鏈接驅動創(chuàng)新
    發(fā)表于 05-30 11:56 ?881次閱讀
    2025研華嵌入式設計論壇上海站:聚焦<b class='flag-5'>Edge</b> Computing &amp;amp; <b class='flag-5'>Edge</b> <b class='flag-5'>AI</b>,共探技術創(chuàng)新與生態(tài)融合

    首創(chuàng)開源架構,天璣AI開發(fā)套件讓端側AI模型接入得心應手

    正式提出“智能體化用戶體驗”方向,并啟動“天璣智能體化體驗領航計劃”。值得注意的是,其三大AI工具鏈的發(fā)布——天璣開發(fā)工具集、AI開發(fā)套件
    發(fā)表于 04-13 19:52

    面向AI與機器學習應用的開發(fā)平臺 AMD/Xilinx Versal? AI Edge VEK280

    AMD/Xilinx Versal? AI Edge VEK280評估套件是一款面向AI與機器學習應用的開發(fā)平臺,專為邊緣計算場景優(yōu)化設計。以下從核心配置、技術特性、應用場景及開發(fā)支持等方面進行詳細
    的頭像 發(fā)表于 04-11 18:33 ?1331次閱讀
    面向<b class='flag-5'>AI</b>與機器學習應用的開發(fā)平臺 AMD/Xilinx Versal? <b class='flag-5'>AI</b> <b class='flag-5'>Edge</b> VEK280

    Edge AI+儲能——能源新方向 2025研華儲能合伙伙伴會議圓滿落幕!

    及合作伙伴參與,共同探討儲能技術創(chuàng)新與產(chǎn)業(yè)智能化升級路徑。 ? 聚焦前沿技術,共話產(chǎn)業(yè)未來 會議開場,研華以《 Edge AI創(chuàng)新方案:加速光儲充產(chǎn)業(yè)智能化應用與高效部署 》為題,分享
    發(fā)表于 04-02 11:32 ?233次閱讀
    <b class='flag-5'>Edge</b> <b class='flag-5'>AI</b>+儲能——能源新方向 2025研華儲能合伙伙伴會議圓滿落幕!

    研華科技全棧式Edge AI產(chǎn)品助力工業(yè)智能化升級

    在2025慕尼黑上海電子設備展上,研華展示了其全棧式Edge AI產(chǎn)品,助力工業(yè)智能化升級。通過邊緣計算與AI技術的深度融合,研華賦能智能
    的頭像 發(fā)表于 03-28 17:23 ?754次閱讀

    ST EDGE AI云服務最后一步無法下載工程是怎么回事?

    ST EDGE AI云服務我選擇使用ST提供的模型,使用cube ai 9.0.0,選擇STM32板卡。之后就按照文檔一步一步操作,基準測試也能運行的到結果(說明云端是生成工程并編譯下載到開發(fā)板中
    發(fā)表于 03-13 08:17

    AI賦能邊緣網(wǎng)關:開啟智能時代的新藍海

    在數(shù)字化轉型的浪潮中,AI與邊緣計算的結合正掀起一場深刻的產(chǎn)業(yè)變革。邊緣網(wǎng)關作為連接物理世界與數(shù)字世界的橋梁,在AI技術的加持下,正從簡單的數(shù)據(jù)采集傳輸節(jié)點,進化為具備智能決策能力的邊緣計算單元
    發(fā)表于 02-15 11:41

    人工智能和機器學習以及Edge AI的概念與應用

    與人工智能相關各種技術的概念介紹,以及先進的Edge AI(邊緣人工智能)的最新發(fā)展與相關應用。 人工智能和機器學習是現(xiàn)代科技的核心技術 人
    的頭像 發(fā)表于 01-25 17:37 ?938次閱讀
    人工<b class='flag-5'>智能</b>和機器學習以及<b class='flag-5'>Edge</b> <b class='flag-5'>AI</b>的概念與應用

    貿澤開售適用于AI和機器學習應用的 AMD Versal AI Edge VEK280評估套件

    2024 年 11 月 19 日 – 專注于引入新品的全球電子元器件和工業(yè)自動化產(chǎn)品授權代理商貿澤電子 (Mouser Electronics) 即日起供應AMD全新Versal? AI Edge
    發(fā)表于 11-21 14:23 ?372次閱讀

    在設備上利用AI Edge Torch生成式API部署自定義大語言模型

    我們很高興地發(fā)布 AI Edge Torch 生成式 API,它能將開發(fā)者用 PyTorch 編寫的高性能大語言模型 (LLM) 部署至 TensorFlow Lite (TFLite) 運行時
    的頭像 發(fā)表于 11-14 10:23 ?1142次閱讀
    在設備上利用<b class='flag-5'>AI</b> <b class='flag-5'>Edge</b> Torch生成式API部署自定義大語言模型

    Google AI Edge Torch的特性詳解

    我們很高興地發(fā)布 Google AI Edge Torch,可將 PyTorch 編寫的模型直接轉換成 TFLite 格式 (.tflite),且有著優(yōu)異的模型覆蓋率和 CPU 性能。TFLite
    的頭像 發(fā)表于 11-06 10:48 ?946次閱讀
    Google <b class='flag-5'>AI</b> <b class='flag-5'>Edge</b> Torch的特性詳解

    使用TI Edge AI Studio和AM62A進行基于視覺AI的缺陷檢測

    電子發(fā)燒友網(wǎng)站提供《使用TI Edge AI Studio和AM62A進行基于視覺AI的缺陷檢測.pdf》資料免費下載
    發(fā)表于 09-03 10:38 ?0次下載
    使用TI <b class='flag-5'>Edge</b> <b class='flag-5'>AI</b> Studio和AM62A進行基于視覺<b class='flag-5'>AI</b>的缺陷檢測

    Edge AI工控機的定義、挑選考量與常見應用

    連接到網(wǎng)絡,并依照特定的安全協(xié)議,允許網(wǎng)絡用戶安全地連線到服務器進行操作。 而近來熱門的Edge AI簡單來說就是邊緣運算 (Edge Computing)?和人工智能 (
    的頭像 發(fā)表于 08-14 10:51 ?912次閱讀