chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

如何讓ResNet50圖像識(shí)別模型在光計(jì)算硬件上飛快運(yùn)行

曦智科技 ? 來(lái)源:曦智科技 ? 2026-03-09 14:21 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

你可能每天都在用圖像識(shí)別:手機(jī)相冊(cè)自動(dòng)歸類(lèi)、刷臉支付、甚至智能相機(jī)的寵物模式。但你有沒(méi)有想過(guò),這些“一眼認(rèn)出”的本領(lǐng),是怎么教出來(lái)的?

今天我們就來(lái)聊聊一個(gè)經(jīng)典的圖像識(shí)別模型——ResNet50,以及如何讓它在光計(jì)算硬件上飛快運(yùn)行。

01ResNet50:50層深度的“視覺(jué)專(zhuān)家”

ResNet50的大名,來(lái)自一個(gè)超級(jí)圖庫(kù)——ImageNet。

2007年,斯坦福教授李飛飛為了讓機(jī)器學(xué)會(huì)認(rèn)東西,牽頭建了這座“看圖識(shí)字界的維基百科”:120萬(wàn)張訓(xùn)練圖、1000個(gè)類(lèi)別,從貓狗汽車(chē)到吉他鸚鵡,應(yīng)有盡有。2010年起每年一屆的ILSVRC比賽,讓AlexNet、VGG、GoogLeNet、ResNet等一眾高手從這里走向世界。ResNet50正是2015年的冠軍,直到今天,“ImageNet預(yù)訓(xùn)練模型”依然是圖像識(shí)別任務(wù)的黃金起點(diǎn)。

ResNet50名字里的“50”不是瞎起的,它真的有50層神經(jīng)網(wǎng)絡(luò)。

你可以把它想象成一個(gè)多層篩選漏斗:

第0層:先粗粗看一遍,提取邊緣、顏色等基本特征(輸入224×224的彩色圖,經(jīng)過(guò)卷積、標(biāo)準(zhǔn)化、激活、池化,變成64×56×56的特征圖);

1~4 stage(每個(gè)stage對(duì)應(yīng)多層):層層遞進(jìn),從紋理、局部形狀,一直組合到完整的貓臉、車(chē)輪等高級(jí)語(yǔ)義;

最后一層:輸出一個(gè)1000維的向量,告訴你是貓(第283類(lèi))的概率是0.85,是狗的概率是0.02……

整個(gè)過(guò)程就像把一張照片不斷放大、再提煉,最終濃縮成一句話:“我覺(jué)得這是XXX”。

02怎么教它認(rèn)東西?像教小孩一樣

訓(xùn)練ResNet50,和教小朋友認(rèn)動(dòng)物卡片差不多:

第一步:準(zhǔn)備練習(xí)題

把圖片統(tǒng)一裁成224×224,再隨機(jī)剪掉一小塊、左右翻一翻——這能增加難度,讓它學(xué)會(huì)“缺了塊耳朵也認(rèn)得出來(lái)”。

第二步:做題、對(duì)答案、糾錯(cuò)

把圖片扔進(jìn)網(wǎng)絡(luò),得到預(yù)測(cè)結(jié)果,和真實(shí)標(biāo)簽比對(duì)(交叉熵?fù)p失函數(shù)算算差多遠(yuǎn)),然后用優(yōu)化器(SGD) 把參數(shù)往正確方向微調(diào)一點(diǎn)點(diǎn)。

第三步:重復(fù)、重復(fù)、再重復(fù)

學(xué)的時(shí)候還得“降溫”:一開(kāi)始學(xué)習(xí)率設(shè)0.01,慢慢在10、20、30輪后降低到原來(lái)的1/10,這樣參數(shù)才震蕩得小,收斂得穩(wěn)。

03給模型“瘦身”:量化,讓它在光引擎上飛馳

今天,光計(jì)算加速卡已經(jīng)可以完美運(yùn)行這個(gè)經(jīng)典圖像分類(lèi)模型。

我們知道,ResNet50全精度模型(32位浮點(diǎn)數(shù))雖然跑得準(zhǔn),但它個(gè)頭大、耗電。如果想讓它在光計(jì)算芯片上實(shí)時(shí)跑圖像分類(lèi),就必須進(jìn)行“瘦身”。

怎么“瘦身”?量化——把32位小數(shù)縮成2位、3位、4位整數(shù)。

好比一張高清照片(32位色)壓縮成GIF(256色),肉眼幾乎看不出差別,文件卻小了幾十倍。

這里有兩種“瘦身”方法:

MOCA工具——PTQ算法

專(zhuān)門(mén)為光計(jì)算硬件定制的量化工具,可以把模型量化為8/4/3/2bit,并轉(zhuǎn)換成光計(jì)算芯片能識(shí)別的ONNX格式。訓(xùn)練時(shí)先加載預(yù)訓(xùn)練好的全精度模型,再用少量數(shù)據(jù)“微調(diào)”一下,恢復(fù)因壓縮損失的精度。

APOT算法

神經(jīng)網(wǎng)絡(luò)里的權(quán)重往往呈鐘形分布,集中在0附近。傳統(tǒng)方法把數(shù)值硬切成幾段,很浪費(fèi)。APOT的做法是:用幾個(gè)2的冪相加來(lái)表示一個(gè)數(shù)值。

比如4bit量化,可以表示出0.0625、0.125、0.25、0.5、0.75……這些數(shù)值分布更符合真實(shí)權(quán)重,3bit量化ResNet-34,Top-1準(zhǔn)確率只掉0.3%,幾乎無(wú)損!

此外,APOT還做了權(quán)重歸一化:先讓權(quán)重變成均值為0、方差為1的標(biāo)準(zhǔn)分布,再裁剪和投影,量化效果更穩(wěn)定。

通過(guò)量化“瘦身”將ResNet50部署到光計(jì)算硬件上,意味著我們給這位“視覺(jué)專(zhuān)家”裝上了一個(gè)“光引擎”。這是經(jīng)典算法與新硬件的“握手”,更是光計(jì)算與人工智能深度融合的一次重要探索。

我們離“光速AI”的愿景又近了一步。

聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 圖像識(shí)別
    +關(guān)注

    關(guān)注

    9

    文章

    534

    瀏覽量

    40183
  • 模型
    +關(guān)注

    關(guān)注

    1

    文章

    3818

    瀏覽量

    52268

原文標(biāo)題:當(dāng)光計(jì)算遇上ResNet50:給圖像識(shí)別模型裝上“光引擎”

文章出處:【微信號(hào):曦智科技,微信公眾號(hào):曦智科技】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    【瑞薩AI挑戰(zhàn)賽】手寫(xiě)數(shù)字識(shí)別模型RA8P1 Titan Board的部署

    手寫(xiě)數(shù)字識(shí)別模型RA8P1 Titan Board的部署 手寫(xiě)數(shù)字識(shí)別計(jì)算機(jī)視覺(jué)領(lǐng)域的經(jīng)典
    發(fā)表于 03-15 20:42

    Zephyr OS啟用NPU的實(shí)用方案

    今天,我們將正式 Zephyr中加入NPU軟件支持,模型不僅能“跑起來(lái)”,還能“跑得飛快”。是的,本期開(kāi)始就是實(shí)戰(zhàn)環(huán)節(jié)!
    的頭像 發(fā)表于 03-09 10:37 ?1052次閱讀
    <b class='flag-5'>在</b>Zephyr OS<b class='flag-5'>上</b>啟用NPU的實(shí)用方案

    小安派BW21-CBV-Kit入門(mén)教程之BLE傳輸DHT數(shù)據(jù)

    作為一款本地AI圖像識(shí)別開(kāi)發(fā)板,BW21-CBV-Kit它能夠獨(dú)自運(yùn)行目標(biāo)識(shí)別模型。2.4GHz+5GHz的雙頻Wi-Fi,提供高性能的無(wú)線傳輸能力,
    的頭像 發(fā)表于 01-22 09:55 ?643次閱讀
    小安派BW21-CBV-Kit入門(mén)教程之BLE傳輸DHT數(shù)據(jù)

    ??低暤\花圖像識(shí)別智能系統(tǒng)推動(dòng)水質(zhì)處理精細(xì)化管控

    為了解決這個(gè)痛點(diǎn),??低曂瞥龅\花圖像識(shí)別智能系統(tǒng)——為水處理提質(zhì)增效,告別單一“肉眼判斷”時(shí)代。
    的頭像 發(fā)表于 01-10 16:08 ?2641次閱讀

    如何精準(zhǔn)驅(qū)動(dòng)菜品識(shí)別模型--基于米爾瑞芯微RK3576邊緣計(jì)算

    ? 人工智能與邊緣計(jì)算深度融合的今天,將AI模型高效部署于終端設(shè)備已成為產(chǎn)業(yè)智能化的關(guān)鍵。本文將分享基于米爾MYD-LR3576邊緣計(jì)算盒子部署菜品
    發(fā)表于 10-31 21:19

    目標(biāo)追蹤的簡(jiǎn)易實(shí)現(xiàn):模板匹配

    一、目標(biāo)追蹤和圖像識(shí)別 一般來(lái)說(shuō),提到機(jī)器視覺(jué)這個(gè)概念都會(huì)想到圖像識(shí)別,比如人臉識(shí)別、文本識(shí)別等等,目標(biāo)追蹤這個(gè)概念在平時(shí)接觸的相對(duì)比較少。但實(shí)際
    發(fā)表于 10-28 07:21

    基于瑞芯微RK3576的resnet50訓(xùn)練部署教程

    Resnet50簡(jiǎn)介ResNet50網(wǎng)絡(luò)是2015年由微軟實(shí)驗(yàn)室的何愷明提出,獲得ILSVRC2015圖像分類(lèi)競(jìng)賽第一名。ResNet網(wǎng)絡(luò)
    的頭像 發(fā)表于 09-10 11:19 ?1469次閱讀
    基于瑞芯微RK3576的<b class='flag-5'>resnet50</b>訓(xùn)練部署教程

    基于米爾MYC-YM90X安路飛龍DR1開(kāi)發(fā)板儀表圖像識(shí)別系統(tǒng)開(kāi)發(fā)

    Linux 等操作系統(tǒng),為系統(tǒng)提供穩(wěn)定的軟件運(yùn)行環(huán)境,負(fù)責(zé)復(fù)雜的系統(tǒng)管理、任務(wù)調(diào)度、用戶(hù)交互以及與外部設(shè)備的通信控制等工作。儀表圖像識(shí)別系統(tǒng)中,ARM 處理器可完成圖像識(shí)別算法的高
    發(fā)表于 08-17 21:29

    華怡豐推出ISC-B/C系列圖像識(shí)別傳感器

    工業(yè)自動(dòng)化領(lǐng)域,精準(zhǔn)、高效的視覺(jué)檢測(cè)是提升生產(chǎn)效率的關(guān)鍵。華怡豐全新推出的ISC-B/C系列圖像識(shí)別傳感器集高精度定位、測(cè)量算法與先進(jìn)圖像處理技術(shù)于一體,為各類(lèi)工業(yè)場(chǎng)景提供穩(wěn)定、可靠的解決方案!
    的頭像 發(fā)表于 08-15 11:36 ?1934次閱讀
    華怡豐推出ISC-B/C系列<b class='flag-5'>圖像識(shí)別</b>傳感器

    火車(chē)車(chē)號(hào)圖像識(shí)別系統(tǒng)如何應(yīng)對(duì)不同光照條件下的識(shí)別問(wèn)題?

    鐵路運(yùn)輸管理中,準(zhǔn)確識(shí)別火車(chē)車(chē)號(hào)是實(shí)現(xiàn)自動(dòng)化車(chē)輛管理的關(guān)鍵環(huán)節(jié)。然而,實(shí)際應(yīng)用場(chǎng)景中復(fù)雜多變的光照條件給車(chē)號(hào)識(shí)別帶來(lái)了巨大挑戰(zhàn)?,F(xiàn)代火車(chē)車(chē)號(hào)圖像識(shí)別系統(tǒng)通過(guò)多項(xiàng)技術(shù)創(chuàng)新,有效解決了這
    的頭像 發(fā)表于 07-15 11:37 ?925次閱讀
    火車(chē)車(chē)號(hào)<b class='flag-5'>圖像識(shí)別</b>系統(tǒng)如何應(yīng)對(duì)不同光照條件下的<b class='flag-5'>識(shí)別</b>問(wèn)題?

    【嘉楠堪智K230開(kāi)發(fā)板試用體驗(yàn)】01 Studio K230開(kāi)發(fā)板Test2——手掌,手勢(shì)檢測(cè),字符檢測(cè)

    K210 的 13.7 倍以上,同時(shí)保持高計(jì)算效率(利用率超過(guò) 70%)。這意味著它能處理更復(fù)雜模型或更多并發(fā)任務(wù)。 KPU 是 CanMV K230 的專(zhuān)用視覺(jué)處理引擎,賦予開(kāi)發(fā)板強(qiáng)大的實(shí)時(shí)圖像識(shí)別
    發(fā)表于 07-10 09:45

    基于LockAI視覺(jué)識(shí)別模塊:手寫(xiě)數(shù)字識(shí)別

    1.1 手寫(xiě)數(shù)字識(shí)別簡(jiǎn)介 手寫(xiě)數(shù)字識(shí)別是一種利用計(jì)算機(jī)視覺(jué)和機(jī)器學(xué)習(xí)技術(shù)自動(dòng)識(shí)別手寫(xiě)數(shù)字的過(guò)程。它通過(guò)圖像預(yù)處理、特征提取和
    發(fā)表于 06-30 16:45

    想用K230放在無(wú)人機(jī)上做圖像識(shí)別,加裝一個(gè)4G模塊把識(shí)別結(jié)果和畫(huà)面同時(shí)傳輸?shù)牡孛嬲净蛘呤謾C(jī)上,怎么操作?

    我想用K230放在無(wú)人機(jī)上做圖像識(shí)別,然后想加裝一個(gè)4G模塊把識(shí)別結(jié)果和畫(huà)面同時(shí)傳輸?shù)牡孛嬲净蛘呤謾C(jī)上,這個(gè)目前可以如何處理? 你好,目前底層是支持4G模塊得驅(qū)動(dòng),參考https
    發(fā)表于 06-16 07:08

    訓(xùn)練完模型后用cls_video.pycanmvIDE運(yùn)行,按著步驟操作但是攝像頭沒(méi)有識(shí)別到是什么情況?

    訓(xùn)練完模型后用cls_video.pycanmvIDE運(yùn)行,按著步驟操作但是攝像頭沒(méi)有識(shí)別到是什么情況啊,沒(méi)有框出現(xiàn)
    發(fā)表于 06-10 06:57