chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

干貨 | 人臉識別技術(shù)全面總結(jié):從傳統(tǒng)方法到深度學(xué)習(xí)

t1PS_TechSugar ? 來源:YXQ ? 2019-05-17 17:07 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

人臉識別是指能夠識別或驗證圖像或視頻中的主體的身份的技術(shù)。首個人臉識別算法誕生于七十年代初 [1,2]。自那以后,它們的準(zhǔn)確度已經(jīng)大幅提升,現(xiàn)在相比于指紋或虹膜識別 [3] 等傳統(tǒng)上被認為更加穩(wěn)健的生物識別方法,人們往往更偏愛人臉識別。讓人臉識別比其它生物識別方法更受歡迎的一大不同之處是人臉識別本質(zhì)上是非侵入性的。比如,指紋識別需要用戶將手指按在傳感器上,虹膜識別需要用戶與相機靠得很近,語音識別則需要用戶大聲說話。相對而言,現(xiàn)代人臉識別系統(tǒng)僅需要用戶處于相機的視野內(nèi)(假設(shè)他們與相機的距離也合理)。這使得人臉識別成為了對用戶最友好的生物識別方法。這也意味著人臉識別的潛在應(yīng)用范圍更廣,因為它也可被部署在用戶不期望與系統(tǒng)合作的環(huán)境中,比如監(jiān)控系統(tǒng)中。人臉識別的其它常見應(yīng)用還包括訪問控制、欺詐檢測、身份認證和社交媒體。

當(dāng)被部署在無約束條件的環(huán)境中時,由于人臉圖像在現(xiàn)實世界中的呈現(xiàn)具有高度的可變性(這類人臉圖像通常被稱為自然人臉(faces in-the-wild)),所以人臉識別也是最有挑戰(zhàn)性的生物識別方法之一。人臉圖像可變的地方包括頭部姿勢、年齡、遮擋、光照條件和人臉表情。圖 1 給出了這些情況的示例。

主成分分析

線性判別分析

人臉識別系統(tǒng)通常由以下構(gòu)建模塊組成:

很多人認為人臉表征是人臉識別系統(tǒng)中最重要的組件,這也是本論文第二節(jié)所關(guān)注的重點。

深度學(xué)習(xí)方法

卷積神經(jīng)網(wǎng)絡(luò)(CNN)是人臉識別方面最常用的一類深度學(xué)習(xí)方法。深度學(xué)習(xí)方法的主要優(yōu)勢是可用大量數(shù)據(jù)來訓(xùn)練,從而學(xué)到對訓(xùn)練數(shù)據(jù)中出現(xiàn)的變化情況穩(wěn)健的人臉表征。這種方法不需要設(shè)計對不同類型的類內(nèi)差異(比如光照、姿勢、面部表情、年齡等)穩(wěn)健的特定特征,而是可以從訓(xùn)練數(shù)據(jù)中學(xué)到它們。深度學(xué)習(xí)方法的主要短板是它們需要使用非常大的數(shù)據(jù)集來訓(xùn)練,而且這些數(shù)據(jù)集中需要包含足夠的變化,從而可以泛化到未曾見過的樣本上。幸運的是,一些包含自然人臉圖像的大規(guī)模人臉數(shù)據(jù)集已被公開 [9-15],可被用來訓(xùn)練 CNN 模型。除了學(xué)習(xí)判別特征,神經(jīng)網(wǎng)絡(luò)還可以降維,并可被訓(xùn)練成分類器或使用度量學(xué)習(xí)方法。CNN 被認為是端到端可訓(xùn)練的系統(tǒng),無需與任何其它特定方法結(jié)合。

用于人臉識別的 CNN 模型可以使用不同的方法來訓(xùn)練。其中之一是將該問題當(dāng)作是一個分類問題,訓(xùn)練集中的每個主體都對應(yīng)一個類別。訓(xùn)練完之后,可以通過去除分類層并將之前層的特征用作人臉表征而將該模型用于識別不存在于訓(xùn)練集中的主體 [99]。在深度學(xué)習(xí)文獻中,這些特征通常被稱為瓶頸特征(bottleneck features)。在這第一個訓(xùn)練階段之后,該模型可以使用其它技術(shù)來進一步訓(xùn)練,以為目標(biāo)應(yīng)用優(yōu)化瓶頸特征(比如使用聯(lián)合貝葉斯 [9] 或使用一個不同的損失函數(shù)來微調(diào)該 CNN 模型 [10])。另一種學(xué)習(xí)人臉表征的常用方法是通過優(yōu)化配對的人臉 [100,101] 或人臉三元組 [102] 之間的距離度量來直接學(xué)習(xí)瓶頸特征。

自組織映射

上面提到的方法都未能取得突破性的成果,主要原因是使用了能力不足的網(wǎng)絡(luò),且訓(xùn)練時能用的數(shù)據(jù)集也相對較小。直到這些模型得到擴展并使用大量數(shù)據(jù) [107] 訓(xùn)練后,用于人臉識別的首個深度學(xué)習(xí)方法 [99,9] 才達到了當(dāng)前最佳水平。尤其值得一提的是 Facebook 的 DeepFace [99],這是最早的用于人臉識別的 CNN 方法之一,其使用了一個能力很強的模型,在 LFW 基準(zhǔn)上實現(xiàn)了 97.35% 的準(zhǔn)確度,將之前最佳表現(xiàn)的錯誤率降低了 27%。研究者使用 softmax 損失和一個包含 440 萬張人臉(來自 4030 個主體)的數(shù)據(jù)集訓(xùn)練了一個 CNN。本論文有兩個全新的貢獻:(1)一個基于明確的 3D 人臉建模的高效的人臉對齊系統(tǒng);(2)一個包含局部連接的層的 CNN 架構(gòu) [108,109],這些層不同于常規(guī)的卷積層,可以從圖像中的每個區(qū)域?qū)W到不同的特征。在那同時,DeepID 系統(tǒng) [9] 通過在圖塊(patch)上訓(xùn)練 60 個不同的 CNN 而得到了相近的結(jié)果,這些圖塊包含十個區(qū)域、三種比例以及 RGB 或灰度通道。在測試階段,會從每個圖塊提取出 160 個瓶頸特征,加上其水平翻轉(zhuǎn)后的情況,可形成一個 19200 維的特征向量(160×2×60)。類似于 [99],新提出的 CNN 架構(gòu)也使用了局部連接的層。其驗證結(jié)果是通過在這種由 CNN 提取出的 19200 維特征向量上訓(xùn)練一個聯(lián)合貝葉斯分類器 [48] 得到的。訓(xùn)練該系統(tǒng)所使用的數(shù)據(jù)集包含 202599 張人臉圖像,來自 10177 位名人 [9]。

對于基于 CNN 的人臉識別方法,影響準(zhǔn)確度的因素主要有三個:訓(xùn)練數(shù)據(jù)、CNN 架構(gòu)和損失函數(shù)。因為在大多數(shù)深度學(xué)習(xí)應(yīng)用中,都需要大訓(xùn)練集來防止過擬合。一般而言,為分類任務(wù)訓(xùn)練的 CNN 的準(zhǔn)確度會隨每類的樣本數(shù)量的增長而提升。這是因為當(dāng)類內(nèi)差異更多時,CNN 模型能夠?qū)W習(xí)到更穩(wěn)健的特征。但是,對于人臉識別,我們感興趣的是提取出能夠泛化到訓(xùn)練集中未曾出現(xiàn)過的主體上的特征。因此,用于人臉識別的數(shù)據(jù)集還需要包含大量主體,這樣模型也能學(xué)習(xí)到更多類間差異。[110] 研究了數(shù)據(jù)集中主體的數(shù)量對人臉識別準(zhǔn)確度的影響。在這項研究中,首先以降序形式按照每個主體的圖像數(shù)量對一個大數(shù)據(jù)集進行了排序。然后,研究者通過逐漸增大主體數(shù)量而使用訓(xùn)練數(shù)據(jù)的不同子集訓(xùn)練了一個 CNN。當(dāng)使用了圖像數(shù)量最多的 10000 個主體進行訓(xùn)練時,得到的準(zhǔn)確度是最高的。增加更多主體會降低準(zhǔn)確度,因為每個額外主體可用的圖像非常少。另一項研究 [111] 研究了更寬度的數(shù)據(jù)集更好,還是更深度的數(shù)據(jù)集更好(如果一個數(shù)據(jù)集包含更多主體,則認為它更寬;類似地,如果每個主體包含的圖像更多,則認為它更深)。這項研究總結(jié)到:如果圖像數(shù)量相等,則更寬的數(shù)據(jù)集能得到更好的準(zhǔn)確度。研究者認為這是因為更寬度的數(shù)據(jù)集包含更多類間差異,因而能更好地泛化到未曾見過的主體上。表 1 展示了某些最常用于訓(xùn)練人臉識別 CNN 的公開數(shù)據(jù)集。

用于人臉識別的 CNN 架構(gòu)從那些在 ImageNet 大規(guī)模視覺識別挑戰(zhàn)賽(ILSVRC)上表現(xiàn)優(yōu)異的架構(gòu)上取得了很多靈感。舉個例子,[11] 中使用了一個帶有 16 層的 VGG 網(wǎng)絡(luò) [112] 版本,[10] 中則使用了一個相似但更小的網(wǎng)絡(luò)。[102] 中探索了兩種不同類型的 CNN 架構(gòu):VGG 風(fēng)格的網(wǎng)絡(luò) [112] 和 GoogleNet 風(fēng)格的網(wǎng)絡(luò) [113]。即使這兩種網(wǎng)絡(luò)實現(xiàn)了相當(dāng)?shù)臏?zhǔn)確度,但 GoogleNet 風(fēng)格的網(wǎng)絡(luò)的參數(shù)數(shù)量少 20 倍。更近段時間,殘差網(wǎng)絡(luò)(ResNet)[114] 已經(jīng)成為了很多目標(biāo)識別任務(wù)的最受偏愛的選擇,其中包括人臉識別 [115-121]。ResNet 的主要創(chuàng)新點是引入了一種使用捷徑連接的構(gòu)建模塊來學(xué)習(xí)殘差映射,如圖 7 所示。捷徑連接的使用能讓研究者訓(xùn)練更深度的架構(gòu),因為它們有助于跨層的信息流動。[121] 對不同的 CNN 架構(gòu)進行了全面的研究。在準(zhǔn)確度、速度和模型大小之間的最佳權(quán)衡是使用帶有一個殘差模塊(類似于 [122] 中提出的那種)的 100 層 ResNet 得到的。

選擇用于訓(xùn)練 CNN 方法的損失函數(shù)已經(jīng)成為近來人臉識別最活躍的研究領(lǐng)域。即使使用 softmax 損失訓(xùn)練的 CNN 已經(jīng)非常成功 [99,9,10,123],但也有研究者認為使用這種損失函數(shù)無法很好地泛化到訓(xùn)練集中未出現(xiàn)過的主體上。這是因為 softmax 損失有助于學(xué)習(xí)能增大類間差異的特征(以便在訓(xùn)練集中區(qū)別不同的類),但不一定會降低類內(nèi)差異。研究者已經(jīng)提出了一些能緩解這一問題的方法。優(yōu)化瓶頸特征的一種簡單方法是使用判別式子空間方法,比如聯(lián)合貝葉斯 [48],就像 [9,124,125,126,10,127] 中所做的那樣。另一種方法是使用度量學(xué)習(xí)。比如,[100,101] 中使用了配對的對比損失來作為唯一的監(jiān)督信號,[124-126] 中還結(jié)合使用了分類損失。人臉識別方面最常用的度量學(xué)習(xí)方法是三元組損失函數(shù) [128],最早在 [102] 中被用于人臉識別任務(wù)。三元組損失的目標(biāo)是以一定余量分開正例對之間的距離和負例對之間的距離。從數(shù)學(xué)形式上講,對于每個三元組 i,需要滿足以下條件 [102]:

其中 x_a 是錨圖像,x_p 是同一主體的圖像,x_n 是另一個不同主體的圖像,f 是模型學(xué)習(xí)到的映射關(guān)系,α 施加在正例對和負例對距離之間的余量。在實踐中,使用三元組損失訓(xùn)練的 CNN 的收斂速度比使用 softmax 的慢,這是因為需要大量三元組(或?qū)Ρ葥p失中的配對)才能覆蓋整個訓(xùn)練集。盡管這個問題可以通過在訓(xùn)練階段選擇困難的三元組(即違反余量條件的三元組)來緩解 [102],但常見的做法是在第一個訓(xùn)練階段使用 softmax 損失訓(xùn)練,在第二個訓(xùn)練階段使用三元組損失來對瓶頸特征進行調(diào)整 [11,129,130]。研究者們已經(jīng)提出了三元組損失的一些變體。比如 [129] 中使用了點積作為相似度度量,而不是歐幾里德距離;[130] 中提出了一種概率式三元組損失;[131,132] 中提出了一種修改版的三元組損失,它也能最小化正例和負例分數(shù)分布的標(biāo)準(zhǔn)差。用于學(xué)習(xí)判別特征的另一種損失函數(shù)是 [133] 中提出的中心損失(centre loss)。中心損失的目標(biāo)是最小化瓶頸特征與它們對應(yīng)類別的中心之間的距離。通過使用 softmax 損失和中心損失進行聯(lián)合訓(xùn)練,結(jié)果表明 CNN 學(xué)習(xí)到的特征能夠有效增大類間差異(softmax 損失)和降低類內(nèi)個體差異(中心損失)。相比于對比損失和三元組損失,中心損失的優(yōu)點是更高效和更容易實現(xiàn),因為它不需要在訓(xùn)練過程中構(gòu)建配對或三元組。另一種相關(guān)的度量學(xué)習(xí)方法是 [134] 中提出的范圍損失(range loss),這是為改善使用不平衡數(shù)據(jù)集的訓(xùn)練而提出的。范圍損失有兩個組件。類內(nèi)的損失組件是最小化同一類樣本之間的 k-最大距離,而類間的損失組件是最大化每個訓(xùn)練批中最近的兩個類中心之間的距離。通過使用這些極端案例,范圍損失為每個類都使用同樣的信息,而不管每個類別中有多少樣本可用。類似于中心損失,范圍損失需要與 softmax 損失結(jié)合起來以避免損失降至零 [133]。

當(dāng)結(jié)合不同的損失函數(shù)時,會出現(xiàn)一個困難,即尋找每一項之間的正確平衡。最近一段時間,已有研究者提出了幾種修改 softmax 損失的方法,這樣它無需與其它損失結(jié)合也能學(xué)習(xí)判別特征。一種已被證明可以增加瓶頸特征的判別能力的方法是特征歸一化 [115,118]。比如,[115] 提出歸一化特征以具有單位 L2 范數(shù),[118] 提出歸一化特征以具有零均值和單位方差。一個成功的方法已經(jīng)在 softmax 損失中每類之間的決策邊界中引入了一個余量 [135]。為了簡單,我們介紹一下使用 softmax 損失進行二元分類的情況。在這種情況下,每類之間的決策邊界(如果偏置為零)可由下式給定:

其中 x 是特征向量,W_1 和 W_2 是對應(yīng)每類的權(quán)重,θ_1 和 θ_2 是 x 分別與 W_1 和 W_2 之間的角度。通過在上式中引入一個乘法余量,這兩個決策邊界可以變得更加嚴格:

如圖 8 所示,這個余量可以有效地增大類別之間的區(qū)分程度以及各自類別之內(nèi)的緊湊性。根據(jù)將該余量整合進損失的方式,研究者們已經(jīng)提出了多種可用方法 [116,119-121]。比如 [116] 中對權(quán)重向量進行了歸一化以具有單位范數(shù),這樣使得決策邊界僅取決于角度 θ_1 和 θ_2。[119,120] 中則提出了一種加性余弦余量。相比于乘法余量 [135,116],加性余量更容易實現(xiàn)和優(yōu)化。在這項工作中,除了歸一化權(quán)重向量,特征向量也如 [115] 中一樣進行了歸一化和比例調(diào)整。[121] 中提出了另一種加性余量,它既有 [119,120] 那樣的優(yōu)點,還有更好的幾何解釋方式,因為這個余量是加在角度上的,而不是余弦上。表 2 總結(jié)了有余量的 softmax 損失的不同變體的決策邊界。這些方法是人臉識別領(lǐng)域的當(dāng)前最佳。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 人臉識別
    +關(guān)注

    關(guān)注

    77

    文章

    4089

    瀏覽量

    84295
  • 深度學(xué)習(xí)
    +關(guān)注

    關(guān)注

    73

    文章

    5561

    瀏覽量

    122795

原文標(biāo)題:【科普】人臉識別技術(shù)全面總結(jié):從傳統(tǒng)方法到深度學(xué)習(xí)

文章出處:【微信號:TechSugar,微信公眾號:TechSugar】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    基于LockAI視覺識別模塊:C++人臉識別

    是實現(xiàn)人臉識別的常用方法深度學(xué)習(xí)方法:現(xiàn)代的人臉識別
    發(fā)表于 07-01 12:01

    深度學(xué)習(xí)賦能:正面吊車載箱號識別系統(tǒng)的核心技術(shù)

    支撐。 深度學(xué)習(xí)驅(qū)動的智能識別 傳統(tǒng)OCR技術(shù)易受光線、污損或箱體圖案干擾,而新一代識別系統(tǒng)通過深度
    的頭像 發(fā)表于 05-07 10:10 ?202次閱讀

    人臉識別技術(shù)的優(yōu)勢與劣勢

    人臉識別技術(shù)的優(yōu)勢 1. 高度準(zhǔn)確性 人臉識別技術(shù)在理想條件下可以達到非常高的準(zhǔn)確性。隨著
    的頭像 發(fā)表于 02-06 18:23 ?1708次閱讀

    人臉識別技術(shù)的算法原理解析

    在數(shù)字化時代,人臉識別技術(shù)已經(jīng)成為身份驗證和安全監(jiān)控的重要手段。這項技術(shù)的核心在于算法,它們能夠圖像中提取關(guān)鍵信息,并與數(shù)據(jù)庫中的信息進行
    的頭像 發(fā)表于 02-06 17:50 ?1763次閱讀

    人臉識別技術(shù)在安全監(jiān)控中的應(yīng)用

    在現(xiàn)代社會,安全監(jiān)控是維護公共安全和社會秩序的重要手段。隨著技術(shù)的進步,傳統(tǒng)的監(jiān)控手段已經(jīng)無法滿足日益增長的安全需求。人臉識別技術(shù)作為一種新
    的頭像 發(fā)表于 02-06 17:25 ?1041次閱讀

    人臉識別技術(shù)的應(yīng)用場景

    在數(shù)字化時代,安全和便捷性成為了人們?nèi)找骊P(guān)注的話題。人臉識別技術(shù)以其獨特的優(yōu)勢,即無需物理接觸、快速識別和高準(zhǔn)確率,成為了解決這些問題的關(guān)鍵技術(shù)
    的頭像 發(fā)表于 02-06 17:20 ?1604次閱讀

    傳統(tǒng)機器學(xué)習(xí)方法和應(yīng)用指導(dǎo)

    用于開發(fā)生物學(xué)數(shù)據(jù)的機器學(xué)習(xí)方法。盡管深度學(xué)習(xí)(一般指神經(jīng)網(wǎng)絡(luò)算法)是一個強大的工具,目前也非常流行,但它的應(yīng)用領(lǐng)域仍然有限。與深度學(xué)習(xí)相比
    的頭像 發(fā)表于 12-30 09:16 ?1191次閱讀
    <b class='flag-5'>傳統(tǒng)</b>機器<b class='flag-5'>學(xué)習(xí)方法</b>和應(yīng)用指導(dǎo)

    如何提升人臉門禁一體機的識別準(zhǔn)確率?

    準(zhǔn)確率,可以以下幾個方面進行改進。一、優(yōu)化算法與模型人臉識別的核心在于算法的優(yōu)化和模型的調(diào)整,目前深度學(xué)習(xí)
    的頭像 發(fā)表于 12-10 15:05 ?1006次閱讀
    如何提升<b class='flag-5'>人臉</b>門禁一體機的<b class='flag-5'>識別</b>準(zhǔn)確率?

    ASR與傳統(tǒng)語音識別的區(qū)別

    ASR(Automatic Speech Recognition,自動語音識別)與傳統(tǒng)語音識別在多個方面存在顯著的區(qū)別。以下是對這兩者的對比: 一、技術(shù)基礎(chǔ) ASR : 基于
    的頭像 發(fā)表于 11-18 15:22 ?1353次閱讀

    AI干貨補給站 | 深度學(xué)習(xí)與機器視覺的融合探索

    ,幫助從業(yè)者積累行業(yè)知識,推動工業(yè)視覺應(yīng)用的快速落地。本期亮點預(yù)告本期將以“深度學(xué)習(xí)與機器視覺的融合探索”為主題,通過講解深度學(xué)習(xí)定義、傳統(tǒng)
    的頭像 發(fā)表于 10-29 08:04 ?577次閱讀
    AI<b class='flag-5'>干貨</b>補給站 | <b class='flag-5'>深度</b><b class='flag-5'>學(xué)習(xí)</b>與機器視覺的融合探索

    GPU深度學(xué)習(xí)應(yīng)用案例

    能力,可以顯著提高圖像識別模型的訓(xùn)練速度和準(zhǔn)確性。例如,在人臉識別、自動駕駛等領(lǐng)域,GPU被廣泛應(yīng)用于加速深度學(xué)習(xí)模型的訓(xùn)練和推理過程。 二
    的頭像 發(fā)表于 10-27 11:13 ?1373次閱讀

    激光雷達技術(shù)的基于深度學(xué)習(xí)的進步

    信息。這使得激光雷達在自動駕駛、無人機、機器人等領(lǐng)域具有廣泛的應(yīng)用前景。 二、深度學(xué)習(xí)技術(shù)的發(fā)展 深度學(xué)習(xí)是機器
    的頭像 發(fā)表于 10-27 10:57 ?1069次閱讀

    深度識別算法包括哪些內(nèi)容

    :CNN是深度學(xué)習(xí)中處理圖像和視頻等具有網(wǎng)格結(jié)構(gòu)數(shù)據(jù)的主要算法。它通過卷積層、池化層和全連接層等組件,實現(xiàn)對圖像特征的自動提取和識別。 應(yīng)用領(lǐng)域 :CNN在圖像識別、目標(biāo)檢測、視頻分
    的頭像 發(fā)表于 09-10 15:28 ?843次閱讀

    深度識別人臉識別有什么重要作用嗎

    深度學(xué)習(xí)人臉識別技術(shù)是人工智能領(lǐng)域的一個重要分支,它利用深度
    的頭像 發(fā)表于 09-10 14:55 ?1142次閱讀

    深度識別人臉識別在任務(wù)中為什么有很強大的建模能力

    深度學(xué)習(xí)人臉識別技術(shù)是人工智能領(lǐng)域中的一個重要分支,它利用深度
    的頭像 發(fā)表于 09-10 14:53 ?838次閱讀