国产片毛片精品天天看视频 ,七七影院

【導(dǎo)語】本文介紹了一個可以生成欺騙性補(bǔ)丁的系統(tǒng)模型，通過將該補(bǔ)丁放置在固定位置，人們能夠使自己在行人檢測器中獲得“隱身”的效果。作者對比了三個不同的生成補(bǔ)丁的方法，并在實際場景中進(jìn)行了評估，發(fā)現(xiàn)基于最小化目標(biāo)分?jǐn)?shù)的方法產(chǎn)生的補(bǔ)丁表現(xiàn)最優(yōu)。

在過去幾年中，機(jī)器學(xué)習(xí)中的對抗攻擊方向吸引了越來越多的研究者。僅需要對卷積神經(jīng)網(wǎng)絡(luò)的輸入進(jìn)行細(xì)微的改變，模型就會被擾動，然后輸出完全不同的結(jié)果。一種攻擊方式是通過輕微改變輸入圖像的像素值來欺騙分類器，使其輸出錯誤的類。其他的方法則是試圖學(xué)習(xí)一個“補(bǔ)丁” (patches)，這個補(bǔ)丁可以應(yīng)用于某個對象去欺騙檢測器和分類器。其中的一些方法的確成功地欺騙了分類器和檢測器，這種欺騙性攻擊在現(xiàn)實生活中也是可行的。但是，現(xiàn)有方法都是針對幾乎沒有類內(nèi)變化的目標(biāo)（例如停止標(biāo)志）。對于此類目標(biāo)，常用的方法為使用對象的已知結(jié)構(gòu)在其上生成一個對抗性補(bǔ)丁。

在本文中，作者提出了一種方法，它可以針對具有許多類內(nèi)變化的目標(biāo)生成對抗補(bǔ)丁，比如人。本文的目標(biāo)是生成能夠成功地將行人隱藏在行人檢測器中的補(bǔ)丁。例如，入侵者可以通過在他們的身體前方拿著一塊小紙板，繞過監(jiān)視系統(tǒng)。

從本文的實驗結(jié)果可以看到，該系統(tǒng)能夠顯著降低行人檢測器的準(zhǔn)確性。當(dāng)使用攝像頭時，其方法在現(xiàn)實生活場景中也能很好地運(yùn)行。該文章是第一篇對類內(nèi)變化較多的目標(biāo)進(jìn)行攻擊的研究。

圖1：論文算法創(chuàng)建的一個能夠成功躲避行人檢測器的對抗補(bǔ)丁。左：成功檢測到?jīng)]有補(bǔ)丁的人。右：持有補(bǔ)丁的人未被檢測到。

卷積神經(jīng)網(wǎng)絡(luò)（CNNs）的興起在計算機(jī)視覺領(lǐng)域取得了巨大成功。 CNN在圖像數(shù)據(jù)中進(jìn)行端到端的學(xué)習(xí)在各種計算機(jī)視覺任務(wù)中都獲得最佳結(jié)果。由于這些網(wǎng)絡(luò)結(jié)構(gòu)的深度，神經(jīng)網(wǎng)絡(luò)能夠從網(wǎng)絡(luò)底部（數(shù)據(jù)進(jìn)入的地方）學(xué)習(xí)到非?；镜倪^濾器特征，并在網(wǎng)絡(luò)頂部學(xué)習(xí)出非常抽象的高級特征。典型的CNN結(jié)構(gòu)往往包含數(shù)百萬個學(xué)習(xí)參數(shù)。雖然這種方法可以得到非常精確的模型，但模型的可解釋性卻大大降低。人們很難準(zhǔn)確理解網(wǎng)絡(luò)將人的圖像分類為人的原因。通過對很多人類圖像的學(xué)習(xí)，神經(jīng)網(wǎng)絡(luò)能夠了解了一個人看起來是什么樣子的。我們可以通過比較模型的輸出與人類注釋的圖像，來評估模型對行人檢測的效果。然而，以這種方式評估模型僅告訴我們檢測器在某個測試集上的執(zhí)行情況。并且，測試集通常不包含誘導(dǎo)模型進(jìn)行錯誤判斷的樣例，也不包含專門欺騙模型的樣例。對于不太可能發(fā)生攻擊的應(yīng)用程序（例如老年人的跌倒檢測），這個問題無可厚非，但在安全系統(tǒng)中可能會帶來問題。安全系統(tǒng)的人員檢測模型中的漏洞可能被用于繞過建筑物中的監(jiān)視攝像機(jī)。

該文章對人類檢測系統(tǒng)遭受攻擊的風(fēng)險進(jìn)行了探討。作者創(chuàng)造了一個小的（40厘米×40厘米）對抗性補(bǔ)?。?a target="_blank">adverserial patch），用于使人躲過目標(biāo)檢測器的檢測。演示如圖1所示。

工作簡述

已有的基于CNN的對抗攻擊主要針對分類任務(wù)、面部識別和物體探測。對于分類任務(wù)的攻擊，Szegedy等人的研究較為成功，他們通過給圖像進(jìn)行輕微的像素調(diào)整，使得模型將圖像歸為錯誤的分類，而這種像素調(diào)整對于人眼來說是無法分辨的。在關(guān)于面部識別攻擊的研究中，Sharif等人使用印刷的眼鏡圖像騙過了人臉識別系統(tǒng)。

現(xiàn)有的物體檢測模型主要包括FCN和Faster-RCNN兩種，一些研究嘗試對上述兩種模型進(jìn)行欺騙和攻擊。Chen等人利用交通標(biāo)志中的停止標(biāo)志，嘗試對Faster-RCNN這一物體探測模型進(jìn)行欺騙，并獲得了成功。但是，已有的工作主要是針對沒有類內(nèi)變化的目標(biāo)。對適用于類間變化大的類的目標(biāo)攻擊方法的探討是較少的。

在現(xiàn)有的攻擊算法中，主要包括白盒攻擊和黑盒攻擊兩種。其中，使用黑盒攻擊的攻擊者不了解模型的具體參數(shù)和算法，僅通過觀察模型的輸入和輸出進(jìn)行攻擊。而白盒攻擊的攻擊者對模型結(jié)構(gòu)、參數(shù)都較為了解，可以直接對模型進(jìn)行針對性的攻擊。無論是黑盒攻擊還是白盒攻擊，都可以用于生成針對模型的對抗性樣本，使得樣本對模型具有欺騙性。

方法

這項工作的目標(biāo)是創(chuàng)建一個能夠生成可打印的對抗補(bǔ)丁的系統(tǒng)，該補(bǔ)丁可用于欺騙行人檢測器。已有研究表明，對現(xiàn)實世界中的物體探測器進(jìn)行對抗性攻擊是可能的。在這項工作中，作者專注于為人生成對抗性補(bǔ)丁。本文通過圖像像素的優(yōu)化過程，嘗試在大型數(shù)據(jù)集上找到能夠有效降低行人檢測的準(zhǔn)確率的補(bǔ)丁。在下面的部分中，作者深入解釋了生成這些對抗補(bǔ)丁的過程。

優(yōu)化目標(biāo)主要包含三部分：

不可打印性得分公式，這個表示補(bǔ)丁中的顏色可以進(jìn)行普通打印的程度

圖像的總變化度，該函數(shù)確保優(yōu)化器支持顏色過渡更加平緩的圖像，并能防止噪聲圖像。如果相鄰像素值的顏色相似，該分?jǐn)?shù)就低，相鄰像素值的顏色差異大，該分?jǐn)?shù)就高。

Lobj是圖像中的最大目標(biāo)分?jǐn)?shù)。該補(bǔ)丁的目標(biāo)是隱藏圖像中的人，因此，模型的訓(xùn)練目標(biāo)是最小化檢測器輸出的物體或類別分?jǐn)?shù)。

總損失函數(shù)由上面三部分內(nèi)容構(gòu)成。在計算時引入了縮放因子alpha和beta。模式使用的優(yōu)化算法為Adam優(yōu)化。針對Lobj的計算，可以參考圖2.

圖2：獲取目標(biāo)損失的概述

最小化檢測器的輸出概率

為了讓檢測器不能檢測出人，作者嘗試了三種不同的方法：一是僅最小化人這一類別的分類概率，二是僅最小化目標(biāo)分?jǐn)?shù)，三是結(jié)合著兩者同時進(jìn)行。通過第一種方法學(xué)到的補(bǔ)丁在視覺上類似于泰迪熊，由于補(bǔ)丁使得人類圖像看起來類似于另一分類，其結(jié)果很難遷移到不包含該分類的模型中。另一種最小化目標(biāo)分?jǐn)?shù)的方法則不存在這種問題。

訓(xùn)練數(shù)據(jù)

與之前為交通標(biāo)志生成對抗補(bǔ)丁的研究相比，為人創(chuàng)建對抗補(bǔ)丁更有挑戰(zhàn)性：

人的外表變化很大：衣服，膚色，身材，姿勢......與始終具有相同八角形狀且通常是紅色的停車標(biāo)志不同。

人可以出現(xiàn)在許多不同的背景中。而停車標(biāo)志大多出現(xiàn)在街道一側(cè)的相同環(huán)境中。

當(dāng)人是朝向或者背對攝像頭時，人的外觀會有所不同。

在人身上放置補(bǔ)丁沒有一致的位置。而在停止標(biāo)志上，可以很容易地計算出補(bǔ)丁的確切位置。

為應(yīng)對上述挑戰(zhàn)，作者沒有像已有研究那樣人工修改目標(biāo)對象的單個圖像并進(jìn)行不同的變換，二是使用了很多人的真實圖像進(jìn)行訓(xùn)練。在模型的訓(xùn)練中，具體步驟如下：首先在圖像數(shù)據(jù)集上運(yùn)行目標(biāo)人物檢測器。探測器會根據(jù)人在圖像中出現(xiàn)的位置顯示人的邊界框。然后，作者將經(jīng)過多種變換的補(bǔ)丁應(yīng)用于圖像中，補(bǔ)丁與邊界狂的相對位置是固定不變的。之后，作者將得到的圖像與其他圖像一起批量送入檢測器，并基于仍然被檢測到人的圖像計算損失函數(shù)。最后，在整個模型中進(jìn)行反向傳播，使用優(yōu)化器進(jìn)一步更改補(bǔ)丁中的像素，以便能更好的欺騙檢測器。

上述方法的一個優(yōu)勢為，模型可使用的數(shù)據(jù)集不僅限于已標(biāo)注的數(shù)據(jù)集。目標(biāo)檢測器可以對任何視頻或圖像集合生成邊界框，這使得系統(tǒng)可以進(jìn)行更有針對性的攻擊。當(dāng)模型從定位的環(huán)境中獲得數(shù)據(jù)時，可以簡單地使用該素材生成特定于該場景的補(bǔ)丁。

模型的測試使用了Inria 數(shù)據(jù)集的圖像。這些圖像主要是行人的全身圖像，更適用于監(jiān)控攝像頭的應(yīng)用。另外，MS COCO 和Pascal VOC 也是兩個關(guān)于行人的數(shù)據(jù)集，但它們包含太多種類的人（例如一只手被注釋為人），很難固定補(bǔ)丁的放置位置，因此沒有使用。

使補(bǔ)丁具有更高的魯棒性

本文的目標(biāo)是針對必須在現(xiàn)實世界中使用的補(bǔ)丁。這意味著首先需要將這些布丁打印出來，然后由攝像機(jī)對其進(jìn)行拍攝。在進(jìn)行上述處理時，很多因素都會影響補(bǔ)丁的外觀：光線可能會發(fā)生變化，補(bǔ)丁可能會稍微旋轉(zhuǎn)，補(bǔ)丁相對于人的大小會發(fā)生變化，相機(jī)可能會稍微增加噪點或模糊補(bǔ)丁，視角可能不同......為了盡可能地考慮這一點，在將補(bǔ)丁應(yīng)用到圖像之前，作者對補(bǔ)丁進(jìn)行一些轉(zhuǎn)換。作者主要進(jìn)行了以下隨機(jī)轉(zhuǎn)換，用于數(shù)據(jù)增強(qiáng)：

將補(bǔ)丁單向旋轉(zhuǎn)20度

隨機(jī)放大和縮小補(bǔ)丁

在補(bǔ)丁上添加隨機(jī)噪聲

隨機(jī)改變補(bǔ)丁的亮度和對比度

需要強(qiáng)調(diào)的是，在對補(bǔ)丁進(jìn)行隨機(jī)更改的過程中，必須保證可以上述操作進(jìn)行反向傳播。

實驗結(jié)果

在本節(jié)中，作者對補(bǔ)丁的有效性進(jìn)行了評估。評估使用的數(shù)據(jù)集是Inria數(shù)據(jù)集的測試集，對補(bǔ)丁的評估過程與訓(xùn)練過程相同，并且包含了對補(bǔ)丁的隨機(jī)轉(zhuǎn)換。在實驗中，作者試圖使一些有可能把人隱藏起來的參數(shù)達(dá)到其最小值。作為對照，作者還將結(jié)果與包含隨機(jī)噪聲的補(bǔ)丁進(jìn)行了比較，該補(bǔ)丁的評估方式與隨機(jī)補(bǔ)丁的評估完全相同。圖3顯示了不同補(bǔ)丁的結(jié)果。 OBJ-CLS的目標(biāo)是最小化目標(biāo)得分和類得分的乘積，在OBJ中僅最小化目標(biāo)得分，在CLS中僅最小化類得分。NOISE是用于對比的包含隨機(jī)噪聲的補(bǔ)丁，CLEAN是沒有應(yīng)用補(bǔ)丁的試驗基線。從這條PR曲線，我們可以清楚地看到生成的補(bǔ)丁（OBJ-CLS，OBJ和CLS）與隨機(jī)生成的補(bǔ)丁的效果對比。我們還可以看到，與使用類分?jǐn)?shù)相比，最小化目標(biāo)分?jǐn)?shù)（OBJ）帶來的影響最大（即具有最低的平均準(zhǔn)確度（AP））。

圖3：與隨機(jī)噪聲補(bǔ)丁（NOISE）和原始圖像（CLEAN）相比，不同方法下（OBJ-CLS，OBJ和CLS）的PR曲線。

作者對于在現(xiàn)實情況中補(bǔ)丁的的效果也進(jìn)行了檢驗，在大多數(shù)情況下補(bǔ)丁都能成功欺騙行人檢測器。由于在模型的訓(xùn)練中，補(bǔ)丁相對于邊界框的位置使固定的，因此補(bǔ)丁放置的位置會對模型效果產(chǎn)生一定影響。

結(jié)論

在本文中，作者提出了一個可生成行人檢測器對抗補(bǔ)丁的系統(tǒng)，該系統(tǒng)生成的補(bǔ)丁可以打印出來并在現(xiàn)實世界中使用。作者在實驗中對比了不同的補(bǔ)丁生成方法，并發(fā)現(xiàn)最小化目標(biāo)損失能產(chǎn)生最有效的補(bǔ)丁。

從文中對打印出來的補(bǔ)丁在真實世界中的測試實驗中可以發(fā)現(xiàn)，該系統(tǒng)產(chǎn)生的補(bǔ)丁非常適用于欺騙行人檢測器，這表明使用類似檢測器的安全系統(tǒng)可能易受到這種攻擊。

作者還提到，如果將這種技術(shù)與衣服結(jié)合起來，就可以設(shè)計出一種T恤印花，讓穿上這種衣服的人能成功的躲避使用YOLO檢測器的智能攝像頭。

在未來，作者希望在以下方面進(jìn)一步探討此問題。一是通過對輸入數(shù)據(jù)進(jìn)行更多（仿射）變換或使用模擬數(shù)據(jù)，進(jìn)一步提高補(bǔ)丁生成系統(tǒng)的魯棒性。二是嘗試提高模型的遷移能力。該系統(tǒng)產(chǎn)生的補(bǔ)丁尚不能很好地遷移到完全不同的模型結(jié)構(gòu)中，作者希望在未來通過使用多種結(jié)構(gòu)的模型進(jìn)行訓(xùn)練，來提高遷移能力。

聲明：本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人，不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用，如有內(nèi)容侵權(quán)或者其他違規(guī)問題，請聯(lián)系本站處理。舉報投訴

檢測器

檢測器

+關(guān)注

關(guān)注
1

文章
894

瀏覽量
48676
神經(jīng)網(wǎng)絡(luò)

神經(jīng)網(wǎng)絡(luò)

+關(guān)注

關(guān)注
42

文章
4814

瀏覽量
103575
圖像

圖像

+關(guān)注

關(guān)注
2

文章
1094

瀏覽量
41240