最新夜里十大禁用app排行榜,精品国产成人a在线观看,每日更新中文字幕av

你可能每天都在用圖像識(shí)別：手機(jī)相冊(cè)自動(dòng)歸類(lèi)、刷臉支付、甚至智能相機(jī)的寵物模式。但你有沒(méi)有想過(guò)，這些“一眼認(rèn)出”的本領(lǐng)，是怎么教出來(lái)的？

今天我們就來(lái)聊聊一個(gè)經(jīng)典的圖像識(shí)別模型——ResNet50，以及如何讓它在光計(jì)算硬件上飛快運(yùn)行。

01ResNet50：50層深度的“視覺(jué)專(zhuān)家”

ResNet50的大名，來(lái)自一個(gè)超級(jí)圖庫(kù)——ImageNet。

2007年，斯坦福教授李飛飛為了讓機(jī)器學(xué)會(huì)認(rèn)東西，牽頭建了這座“看圖識(shí)字界的維基百科”：120萬(wàn)張訓(xùn)練圖、1000個(gè)類(lèi)別，從貓狗汽車(chē)到吉他鸚鵡，應(yīng)有盡有。2010年起每年一屆的ILSVRC比賽，讓AlexNet、VGG、GoogLeNet、ResNet等一眾高手從這里走向世界。ResNet50正是2015年的冠軍，直到今天，“ImageNet預(yù)訓(xùn)練模型”依然是圖像識(shí)別任務(wù)的黃金起點(diǎn)。

ResNet50名字里的“50”不是瞎起的，它真的有50層神經(jīng)網(wǎng)絡(luò)。

你可以把它想象成一個(gè)多層篩選漏斗：

第0層：先粗粗看一遍，提取邊緣、顏色等基本特征（輸入224×224的彩色圖，經(jīng)過(guò)卷積、標(biāo)準(zhǔn)化、激活、池化，變成64×56×56的特征圖）；

1~4 stage（每個(gè)stage對(duì)應(yīng)多層）：層層遞進(jìn)，從紋理、局部形狀，一直組合到完整的貓臉、車(chē)輪等高級(jí)語(yǔ)義；

最后一層：輸出一個(gè)1000維的向量，告訴你是貓（第283類(lèi)）的概率是0.85，是狗的概率是0.02……

整個(gè)過(guò)程就像把一張照片不斷放大、再提煉，最終濃縮成一句話：“我覺(jué)得這是XXX”。

02怎么教它認(rèn)東西？像教小孩一樣

訓(xùn)練ResNet50，和教小朋友認(rèn)動(dòng)物卡片差不多：

第一步：準(zhǔn)備練習(xí)題

把圖片統(tǒng)一裁成224×224，再隨機(jī)剪掉一小塊、左右翻一翻——這能增加難度，讓它學(xué)會(huì)“缺了塊耳朵也認(rèn)得出來(lái)”。

第二步：做題、對(duì)答案、糾錯(cuò)

把圖片扔進(jìn)網(wǎng)絡(luò)，得到預(yù)測(cè)結(jié)果，和真實(shí)標(biāo)簽比對(duì)（交叉熵?fù)p失函數(shù)算算差多遠(yuǎn)），然后用優(yōu)化器（SGD）把參數(shù)往正確方向微調(diào)一點(diǎn)點(diǎn)。

第三步：重復(fù)、重復(fù)、再重復(fù)

學(xué)的時(shí)候還得“降溫”：一開(kāi)始學(xué)習(xí)率設(shè)0.01，慢慢在10、20、30輪后降低到原來(lái)的1/10，這樣參數(shù)才震蕩得小，收斂得穩(wěn)。

03給模型“瘦身”：量化，讓它在光引擎上飛馳

今天，光計(jì)算加速卡已經(jīng)可以完美運(yùn)行這個(gè)經(jīng)典圖像分類(lèi)模型。

我們知道，ResNet50全精度模型（32位浮點(diǎn)數(shù)）雖然跑得準(zhǔn)，但它個(gè)頭大、耗電。如果想讓它在光計(jì)算芯片上實(shí)時(shí)跑圖像分類(lèi)，就必須進(jìn)行“瘦身”。

怎么“瘦身”？量化——把32位小數(shù)縮成2位、3位、4位整數(shù)。

好比一張高清照片（32位色）壓縮成GIF（256色），肉眼幾乎看不出差別，文件卻小了幾十倍。

這里有兩種“瘦身”方法：

MOCA工具——PTQ算法

專(zhuān)門(mén)為光計(jì)算硬件定制的量化工具，可以把模型量化為8/4/3/2bit，并轉(zhuǎn)換成光計(jì)算芯片能識(shí)別的ONNX格式。訓(xùn)練時(shí)先加載預(yù)訓(xùn)練好的全精度模型，再用少量數(shù)據(jù)“微調(diào)”一下，恢復(fù)因壓縮損失的精度。

APOT算法

神經(jīng)網(wǎng)絡(luò)里的權(quán)重往往呈鐘形分布，集中在0附近。傳統(tǒng)方法把數(shù)值硬切成幾段，很浪費(fèi)。APOT的做法是：用幾個(gè)2的冪相加來(lái)表示一個(gè)數(shù)值。

比如4bit量化，可以表示出0.0625、0.125、0.25、0.5、0.75……這些數(shù)值分布更符合真實(shí)權(quán)重，3bit量化ResNet-34，Top-1準(zhǔn)確率只掉0.3%，幾乎無(wú)損！

此外，APOT還做了權(quán)重歸一化：先讓權(quán)重變成均值為0、方差為1的標(biāo)準(zhǔn)分布，再裁剪和投影，量化效果更穩(wěn)定。

通過(guò)量化“瘦身”將ResNet50部署到光計(jì)算硬件上，意味著我們給這位“視覺(jué)專(zhuān)家”裝上了一個(gè)“光引擎”。這是經(jīng)典算法與新硬件的“握手”，更是光計(jì)算與人工智能深度融合的一次重要探索。

我們離“光速AI”的愿景又近了一步。

聲明：本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人，不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用，如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題，請(qǐng)聯(lián)系本站處理。舉報(bào)投訴

圖像識(shí)別

圖像識(shí)別

+關(guān)注

關(guān)注
9

文章
534

瀏覽量
40183
模型

模型

+關(guān)注

關(guān)注
1

文章
3818

瀏覽量
52268

原文標(biāo)題：當(dāng)光計(jì)算遇上ResNet50：給圖像識(shí)別模型裝上“光引擎”

文章出處：【微信號(hào)：曦智科技，微信公眾號(hào)：曦智科技】歡迎添加關(guān)注！文章轉(zhuǎn)載請(qǐng)注明出處。

chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛兴趣闲谈,欧美亚洲精品 8区,国产精品久久久久精品免费

搜索歷史

如何讓ResNet50圖像識(shí)別模型在光計(jì)算硬件上飛快運(yùn)行

評(píng)論