chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

如何在推理引擎中脫穎而出

星星科技指導(dǎo)員 ? 來(lái)源:嵌入式計(jì)算設(shè)計(jì) ? 作者:Geoff Tate ? 2022-07-06 14:48 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

隨著人工智能的爆炸式增長(zhǎng),人們?cè)絹?lái)越關(guān)注能夠提供人工智能所需性能的新型專(zhuān)業(yè)推理引擎。因此,在過(guò)去六個(gè)月中,我們看到了一系列神經(jīng)推理硬件公告,所有這些都承諾提供比市場(chǎng)上任何其他產(chǎn)品更好的加速。然而,挑戰(zhàn)在于沒(méi)有人真正知道如何衡量一個(gè)與另一個(gè)。這是一項(xiàng)新技術(shù),就像任何新技術(shù)一樣,我們需要指標(biāo),我們需要真正重要的指標(biāo)。

一切都與吞吐量有關(guān)

當(dāng)推理引擎的性能出現(xiàn)時(shí),供應(yīng)商會(huì)拋出諸如 TOPS(Tera-Operations/Second)性能和 TOPS/Watt 之類(lèi)的基準(zhǔn)。研究這些的系統(tǒng)/芯片設(shè)計(jì)人員很快意識(shí)到這些數(shù)字通常毫無(wú)意義。真正重要的是推理引擎可以為模型、圖像大小、批量大小和過(guò)程以及 PVT(過(guò)程/電壓/溫度)條件提供多少吞吐量。這是衡量其性能表現(xiàn)的第一個(gè)衡量標(biāo)準(zhǔn),但令人驚訝的是,很少有供應(yīng)商提供它。

TOPS 的最大問(wèn)題是,當(dāng)一家公司說(shuō)他們的引擎執(zhí)行 X TOPS 時(shí),他們通常會(huì)引用這一點(diǎn)而沒(méi)有說(shuō)明條件是什么。在不知道這些信息的情況下,他們錯(cuò)誤地認(rèn)為 X TOPS 意味著它可以執(zhí)行 X 萬(wàn)億次操作。實(shí)際上,報(bào)價(jià) 130 TOPS 的公司可能僅提供 27 TOPS 的可用吞吐量。

另一個(gè)正在使用但不太常用的基準(zhǔn)是 ResNet-50。這個(gè)基準(zhǔn)的問(wèn)題是大多數(shù)引用它的公司都沒(méi)有給出批量大小。如果他們不這樣做,芯片設(shè)計(jì)人員可以假設(shè)這將是一個(gè)大批量,以最大限度地提高他們的硬件利用率。這使得 ResNet-50 作為基準(zhǔn)不是很有幫助。相比之下,例如 YOLOv3 需要 100 倍以上的操作來(lái)處理 2 兆像素的圖像。在“真實(shí)世界”模型中,硬件利用率將面臨更大挑戰(zhàn)。

如何正確測(cè)量神經(jīng)推理引擎

在評(píng)估神經(jīng)推理引擎時(shí),需要注意幾個(gè)關(guān)鍵事項(xiàng)。以下是最重要的考慮因素以及它們?yōu)楹握嬲匾脑颉?/p>

定義什么是操作:一些供應(yīng)商將乘法(通常為 INT 8 乘以 INT 8)計(jì)為一次操作,將累加(加法,通常為 INT 32)計(jì)為一次操作。因此,一次乘法累加等于 2 次操作。但是,一些供應(yīng)商在其 TOPS 規(guī)范中包含其他類(lèi)型的操作,因此必須在開(kāi)始時(shí)進(jìn)行澄清。

詢(xún)問(wèn) 操作條件是什么: 如果供應(yīng)商提供 TOPS 而不提供條件,他們通常使用室溫、標(biāo)稱(chēng)電壓和典型工藝。通常他們會(huì)提到他們所指的工藝節(jié)點(diǎn),但不同供應(yīng)商的運(yùn)行速度不同,大多數(shù)工藝提供2、3或更多的標(biāo)稱(chēng)電壓。由于性能是頻率的函數(shù),而頻率是電壓的函數(shù),因此芯片設(shè)計(jì)人員在 0.9V 時(shí)可以獲得比在 0.6V 時(shí)高兩倍以上的性能。頻率因條件/假設(shè)而異。有關(guān)這方面的更多信息,請(qǐng)參閱此應(yīng)用說(shuō)明。

看看批量大小:即使供應(yīng)商提供最壞情況的 TOPS,芯片設(shè)計(jì)人員也需要弄清楚所有這些操作是否真的有助于計(jì)算他們的神經(jīng)網(wǎng)絡(luò)模型。實(shí)際上,實(shí)際利用率可能非常低,因?yàn)闆](méi)有推理引擎始終 100% 地使用所有 MAC。這就是批量大小很重要的原因。批處理是為給定層加載權(quán)重并同時(shí)處理多個(gè)數(shù)據(jù)集。這樣做的原因是為了提高吞吐量,但放棄的是更長(zhǎng)的延遲。ResNet-50 擁有超過(guò) 2000 萬(wàn)個(gè)權(quán)重;YOLOv3 擁有超過(guò) 6000 萬(wàn)個(gè)權(quán)重;并且必須為每個(gè)圖像獲取每個(gè)權(quán)重并將其加載到 MAC 結(jié)構(gòu)中。權(quán)重太多,無(wú)法讓它們都駐留在 MAC 結(jié)構(gòu)中。

poYBAGLFMEOAYgAkAAFI6_5PqUw443.png

找出你的 MAC 利用率:并非所有神經(jīng)網(wǎng)絡(luò)的行為都相同。您需要以您需要的批量大小找出您想要部署的神經(jīng)網(wǎng)絡(luò)模型的神經(jīng)推理引擎的實(shí)際 MAC 利用率。

深入TOPS

如果您是一名正在研究神經(jīng)推理引擎的設(shè)計(jì)師,希望這篇文章能夠闡明要尋找的內(nèi)容。請(qǐng)記住——重要的是吞吐量。重要的是不要陷入諸如 TOPS 和 ResNet-50 之類(lèi)的毫無(wú)意義的基準(zhǔn)測(cè)試中,除非您知道圍繞這些問(wèn)題要問(wèn)的問(wèn)題。首先提出以下問(wèn)題:在批量大小 = A 和 XYZ PVT 條件下,可以為特定模型(例如 YOLOv3)處理多少圖像/秒。一旦您開(kāi)始指定條件和假設(shè),您將開(kāi)始了解任何神經(jīng)推理在現(xiàn)實(shí)世界中的表現(xiàn)如何。歸根結(jié)底,這才是最重要的。

審核編輯:郭婷

聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 芯片
    +關(guān)注

    關(guān)注

    460

    文章

    52520

    瀏覽量

    441140
  • 神經(jīng)網(wǎng)絡(luò)

    關(guān)注

    42

    文章

    4814

    瀏覽量

    103670
  • 人工智能
    +關(guān)注

    關(guān)注

    1807

    文章

    49029

    瀏覽量

    249636
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    信而泰×DeepSeek:AI推理引擎驅(qū)動(dòng)網(wǎng)絡(luò)智能診斷邁向 “自愈”時(shí)代

    定位到出口路由器端口存在大量物理層錯(cuò)誤計(jì)數(shù),更換光模塊后,故障立即排除,業(yè)務(wù)完全恢復(fù)正常。此案例充分驗(yàn)證了AI推理引擎在復(fù)雜網(wǎng)絡(luò)故障診斷精準(zhǔn)定位根因、大幅提升排障效率的核心價(jià)值。
    發(fā)表于 07-16 15:29

    3大優(yōu)勢(shì),讓鋰電池外殼氣密性檢測(cè)儀脫穎而出

    應(yīng)運(yùn)而生,憑借三大顯著優(yōu)勢(shì),在眾多同類(lèi)產(chǎn)品脫穎而出。優(yōu)勢(shì)一:高精度檢測(cè)技術(shù)。鋰電池外殼氣密性檢測(cè)儀采用先進(jìn)的傳感器技術(shù)和算法,能夠?qū)崿F(xiàn)對(duì)鋰電池外殼微小泄漏的精準(zhǔn)識(shí)別
    的頭像 發(fā)表于 04-18 13:42 ?238次閱讀
    3大優(yōu)勢(shì),讓鋰電池外殼氣密性檢測(cè)儀<b class='flag-5'>脫穎而出</b>

    在#BMC 供電領(lǐng)域中,#思瑞浦 #LDO 產(chǎn)品TPL9308為何能脫穎而出?

    行業(yè)芯事行業(yè)資訊
    思瑞浦3PEAK
    發(fā)布于 :2025年03月28日 17:19:32

    單晶硅納米力學(xué)性能測(cè)試方法

    在材料納米力學(xué)性能測(cè)試的眾多方法,納米壓痕技術(shù)憑借其獨(dú)特的優(yōu)勢(shì)脫穎而出,成為當(dāng)前的主流測(cè)試手段。
    的頭像 發(fā)表于 03-25 14:38 ?471次閱讀
    單晶硅納米力學(xué)性能測(cè)試方法

    何在C#中部署飛槳PP-OCRv4模型

    《超4萬(wàn)6千星的開(kāi)源OCR黑馬登場(chǎng),PaddleOCR憑什么脫穎而出?》收到了讀者熱烈反響c,很多讀者提出:如何在C#中部署飛槳PP-OCRv4模型?本文從零開(kāi)始詳細(xì)介紹整個(gè)過(guò)程。
    的頭像 發(fā)表于 02-17 10:58 ?1793次閱讀
    如<b class='flag-5'>何在</b>C#中部署飛槳PP-OCRv4模型

    蔡司三坐標(biāo)自動(dòng)化解決方案提升企業(yè)效率的智能化伙伴

    ,企業(yè)正面臨著前所未有的挑戰(zhàn)與機(jī)遇。如何在激烈的市場(chǎng)競(jìng)爭(zhēng)脫穎而出,實(shí)現(xiàn)高效、精準(zhǔn)的生產(chǎn),成為眾多企業(yè)關(guān)注的焦點(diǎn)。而蔡司工業(yè)測(cè)量自動(dòng)化技術(shù),憑借其先進(jìn)的模塊化設(shè)計(jì)
    的頭像 發(fā)表于 02-13 11:11 ?413次閱讀
    蔡司三坐標(biāo)自動(dòng)化解決方案提升企業(yè)效率的智能化伙伴

    工業(yè)網(wǎng)關(guān):開(kāi)啟制造工程高效生產(chǎn)新時(shí)代

    在科技飛速發(fā)展的當(dāng)下,制造業(yè)正經(jīng)歷著前所未有的變革。如何在激烈的市場(chǎng)競(jìng)爭(zhēng)脫穎而出,實(shí)現(xiàn)高效生產(chǎn)成為了眾多制造企業(yè)的核心追求。而明達(dá)技術(shù)MBox20工業(yè)網(wǎng)關(guān),作為工業(yè)互聯(lián)網(wǎng)的關(guān)鍵樞紐,正悄然改變著制造工程的格局。
    的頭像 發(fā)表于 02-07 10:08 ?310次閱讀

    選用哪款條碼掃描引擎嵌入手持終端類(lèi)使用?尺寸小巧讀取率高?

    引擎為何能在眾多產(chǎn)品脫穎而出,成為嵌入手持終端的理想選擇。LV30條碼掃描引擎以其緊湊的設(shè)計(jì)著稱(chēng),這一特性使得它能夠輕松融入各種尺寸的手持終端
    的頭像 發(fā)表于 01-06 15:19 ?323次閱讀
    選用哪款條碼掃描<b class='flag-5'>引擎</b>嵌入手持終端類(lèi)使用?尺寸小巧讀取率高?

    喜報(bào)!全國(guó)首批!賽思成功獲選國(guó)家級(jí)專(zhuān)精特新重點(diǎn)“小巨人”企業(yè)!

    萬(wàn)里挑一!賽思從16000多家專(zhuān)精特新“小巨人”企業(yè)脫穎而出,榮獲國(guó)家級(jí)專(zhuān)精特新“重點(diǎn)小巨人企業(yè)。
    的頭像 發(fā)表于 12-05 11:46 ?350次閱讀
    喜報(bào)!全國(guó)首批!賽思成功獲選國(guó)家級(jí)專(zhuān)精特新重點(diǎn)“小巨人”企業(yè)!

    重磅!賽思榮膺投資家網(wǎng)“2024年度最具投資價(jià)值企業(yè)TOP100”!

    入選率僅2%!賽思憑借在時(shí)鐘同步及混合數(shù)模領(lǐng)域的卓絕表現(xiàn),從4600余家企業(yè)脫穎而出!
    的頭像 發(fā)表于 12-03 18:52 ?674次閱讀
    重磅!賽思榮膺投資家網(wǎng)“2024年度最具投資價(jià)值企業(yè)TOP100”!

    尼爾森數(shù)據(jù)背后:Shokz韶音如何在全球運(yùn)動(dòng)耳機(jī)市場(chǎng)脫穎而出

    全球市場(chǎng)調(diào)研機(jī)構(gòu)尼爾森,近日在巴黎馬拉松期間發(fā)布了Sport2024調(diào)研報(bào)告。數(shù)據(jù)表明,68%的消費(fèi)者在跑步時(shí)有聽(tīng)音樂(lè)的習(xí)慣,而在消費(fèi)者跑步時(shí)最常佩戴的耳機(jī)品牌,蘋(píng)果、韶音等榜上有名。其中,定位
    的頭像 發(fā)表于 11-18 14:53 ?660次閱讀
    尼爾森數(shù)據(jù)背后:Shokz韶音如<b class='flag-5'>何在</b>全球運(yùn)動(dòng)耳機(jī)市場(chǎng)<b class='flag-5'>脫穎而出</b>

    李開(kāi)復(fù):中國(guó)擅長(zhǎng)打造經(jīng)濟(jì)實(shí)惠的AI推理引擎

    10月22日上午,零一萬(wàn)物公司的創(chuàng)始人兼首席執(zhí)行官李開(kāi)復(fù)在與外媒的交流透露,其公司旗下的Yi-Lightning(閃電模型)在推理成本上已實(shí)現(xiàn)了顯著優(yōu)勢(shì),比OpenAI的GPT-4o模型低了31倍。他強(qiáng)調(diào),中國(guó)擅長(zhǎng)打造經(jīng)濟(jì)實(shí)惠的AI
    的頭像 發(fā)表于 10-22 16:54 ?740次閱讀

    國(guó)產(chǎn)MCU廠商,靠什么從內(nèi)卷脫穎而出

    導(dǎo)語(yǔ)在當(dāng)下內(nèi)卷的大環(huán)境下,航順芯片是如何消除內(nèi)卷,突破高端的?當(dāng)前,全球半導(dǎo)體行業(yè)正經(jīng)歷寒冬。受經(jīng)濟(jì)環(huán)境疲軟、消費(fèi)需求減弱、庫(kù)存調(diào)整等因素影響,半導(dǎo)體市場(chǎng)增速顯著放緩。在這種背景下,半導(dǎo)體廠商間的競(jìng)爭(zhēng)日益激烈,價(jià)格戰(zhàn)已成常態(tài),MCU市場(chǎng)亦不例外。SIA數(shù)據(jù)顯示,中國(guó)MCU市場(chǎng)占全球25%左右。盡管市場(chǎng)規(guī)模龐大,但國(guó)內(nèi)MCU廠商的產(chǎn)品主要集中在中低端市場(chǎng),同質(zhì)
    的頭像 發(fā)表于 10-22 16:20 ?725次閱讀
    國(guó)產(chǎn)MCU廠商,靠什么從內(nèi)卷<b class='flag-5'>中</b><b class='flag-5'>脫穎而出</b>?

    澎峰科技高性能大模型推理引擎PerfXLM解析

    模型的高性能推理框架,并受到廣泛關(guān)注。在歷經(jīng)數(shù)月的迭代開(kāi)發(fā)后,澎峰科技重磅發(fā)布升級(jí)版本,推出全新的高性能大模型推理引擎:PerfXLM。
    的頭像 發(fā)表于 09-29 10:14 ?1480次閱讀
    澎峰科技高性能大模型<b class='flag-5'>推理</b><b class='flag-5'>引擎</b>PerfXLM解析

    何在華東電機(jī)控制器市場(chǎng)脫穎而出?

    華東電機(jī)控制器市場(chǎng)的創(chuàng)新方向,文中參考答案都有了。 前言: 隨著工業(yè)自動(dòng)化和智能化進(jìn)程的加速推進(jìn),電機(jī)控制器作為驅(qū)動(dòng)系統(tǒng)的核心部件,在推動(dòng)產(chǎn)業(yè)升級(jí)轉(zhuǎn)型扮演著至關(guān)重要的角色。華東電機(jī)控制器市場(chǎng)以其
    的頭像 發(fā)表于 08-05 10:59 ?477次閱讀
    如<b class='flag-5'>何在</b>華東電機(jī)控制器市場(chǎng)<b class='flag-5'>脫穎而出</b>?