chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

基于深度學習的人臉識別算法與其網(wǎng)絡(luò)結(jié)構(gòu)

新機器視覺 ? 來源:CSDN技術(shù)社區(qū) ? 作者:weixin_39667398 ? 2021-03-12 11:13 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

度量學習

基于深度學習的人臉識別算法,如何讓神經(jīng)網(wǎng)絡(luò)從訓(xùn)練數(shù)據(jù)中學習到有效、魯棒的生物特征是至關(guān)重要的。在這個過程中,一個良好的學習向?qū)遣豢苫蛉钡?。因此,在模型?xùn)練的過程中,通常使用度量學習的方式,將人物面部特征間的距離,作為神經(jīng)網(wǎng)絡(luò)特征學習的向?qū)?,來實現(xiàn)區(qū)分不同人物的目的。

為了讓神經(jīng)網(wǎng)絡(luò)能夠更加有效的學習,合理的設(shè)計損失函數(shù)來度量和映射人物特征之間的距離,成為了提高人臉識別精度的主要研究方向之一。許多在分類任務(wù)中常用的損失函數(shù),如Softmax Loss,在經(jīng)過一系列的改進之后,更好的適應(yīng)了人臉識別的任務(wù)。像Arcface這樣的損失函數(shù)(下圖),利用了一種附加角度對cos值進行加法約束,使得模型能夠在學習過程中合理的壓縮相同人物特征間的余弦距離的同時增大不同人物特征間的余弦距離,以此達到精準區(qū)分人物的目的。

圖示展示在利用損失函數(shù)arcface訓(xùn)練一個深度卷積神經(jīng)網(wǎng)絡(luò)過程中的計算流程。其中的改進在于,給角度加入了加性間隔m作為懲罰項來減小類間間距,并對其余弦值加入放縮s進行放縮,讓網(wǎng)絡(luò)變得易于訓(xùn)練。

另一些損失函數(shù),如Triplet Loss(下圖),則是通過以特定規(guī)則從訓(xùn)練集中選擇樣例,提取特征,比較這些特征之間的距離,來達到聚類相同人物特征和離散不同人物特征的目的??梢钥吹?,這種方法因為要逐次比對選擇樣例特征之間的距離并基于此來優(yōu)化模型參數(shù),所以會延長模型訓(xùn)練的周期。但對于解決一些特殊場景下的困難樣例,會有較好的效果。

圖示為最初版本的Triplet Loss原理示意圖。訓(xùn)練過程中需要從訓(xùn)練集中選擇一個Anchor樣本以及與Anchor樣本同類的Positive樣本和與Anchor樣本異類的Negative樣本,在訓(xùn)練過程中不斷的拉近同類樣本的距離并遠離異類樣本。

選擇不同的損失函數(shù),會對模型進行識別任務(wù)時選用的距離公式(相似度計算方法)產(chǎn)生影響。例如,Triplet Loss在早期優(yōu)化的是歐氏距離,所以在后期進行特征比對時,利用歐式距離來計算特征之間相似度就是更加自然的。此外,通過對這些損失函數(shù)進行變形,來統(tǒng)一各損失函數(shù)的優(yōu)化距離,從而使不同的損失函數(shù)能夠運用在訓(xùn)練模型的不同階段,或?qū)⒉煌瑩p失函數(shù)對不同的樣例分配進行結(jié)合,從而達到更高效的訓(xùn)練效率,也是目前的工作方向之一。

網(wǎng)絡(luò)結(jié)構(gòu)

根據(jù)使用場景和計算設(shè)備的不同,通常需要選擇不同規(guī)模的神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)。隨著人臉識別在移動端的普及以及識別規(guī)模的增大,選用計算量更小、更高效的網(wǎng)絡(luò)結(jié)構(gòu)成為了重要的研究方向。

標準的卷積神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu),以VGG16為例,通常由卷積層,池化層,全連接層和激活函數(shù)組成。該網(wǎng)絡(luò)通過反復(fù)堆疊3*3的小型卷積核和2*2的最大池化層,不斷加深網(wǎng)絡(luò)結(jié)構(gòu)來提升性能。

但隨著網(wǎng)絡(luò)結(jié)構(gòu)的進一步加深,網(wǎng)絡(luò)參數(shù)會隨之增多,運算開銷會變得很大,增加運算成本。同時,網(wǎng)絡(luò)結(jié)構(gòu)的加深也會讓網(wǎng)絡(luò)發(fā)生退化現(xiàn)象,以至于在進一步訓(xùn)練時無法達到預(yù)期的精度。

為解決這些問題,設(shè)計出參數(shù)少,深度深,運算快,易于訓(xùn)練的輕量級網(wǎng)絡(luò)網(wǎng)絡(luò),各種卷積結(jié)構(gòu)和模塊被逐步引入到了卷積神經(jīng)網(wǎng)絡(luò)的基礎(chǔ)構(gòu)架中。

殘差模塊:為解決加深網(wǎng)絡(luò)后的網(wǎng)絡(luò)退化問題,使深度網(wǎng)絡(luò)變得可訓(xùn)練而提出的結(jié)構(gòu)(見下圖)。這種跳躍連接的結(jié)構(gòu)讓網(wǎng)絡(luò)有能力在需要的時候擬合一個潛在的恒等映射函數(shù),從而避免了在極深網(wǎng)絡(luò)中出現(xiàn)的難以訓(xùn)練的問題。

分組卷積:在標準的卷積操作中,其參數(shù)量與輸入特征圖通道數(shù),卷積核尺寸和輸出特征圖通道數(shù)有關(guān)。如圖,若輸入特征圖尺寸為H*W*c1,卷積核尺寸為h1*w1*c1,輸出特征圖尺寸為H*W*c2,標準卷幾層的參數(shù)量則為:h1*w1*c1*c2。

若使用分組卷積(見下圖),事先將輸入的特征圖按照通道數(shù)分為g組,分組卷積的參數(shù)量為則會變成標準卷積參數(shù)量的1/g:h1*w1*c1*c2/g。

分組卷積能夠在一定程度上降低卷積的參數(shù)量,但也會減弱各通道之間的相關(guān)性。

深度可分離卷積:深度可分離卷積操作是將普通卷積拆解成深度卷積和逐點卷積。深度卷積負責濾波,逐點卷積負責轉(zhuǎn)換通道。

如圖(a),對于標準卷積,其參數(shù)量為Dk*Dk*M*N。如圖(b),對于深度卷積,其參數(shù)量為:Dk*Dk*1*M。 如圖(c),對于逐點卷積,其參數(shù)量為:1*1*M*N。將兩項操作合并,可知深度可分離卷積參數(shù)量 是標準卷積的:(1/N)+(1/Dk**2)。

cafaa5e6-82ca-11eb-8b86-12bb97331649.png

棄用池化層:池化層分為平均池化和最大池化,通過制定規(guī)則對池化核覆蓋范圍內(nèi)的像素進行運算,達到學習圖像邊緣及紋理結(jié)構(gòu),同時壓縮特征圖的效果。但池化層常常會導(dǎo)致較多的信息損失,因此,通常使用控制卷積核在特征圖上的滑動步長(如設(shè)定stride=2),來達到壓縮特征圖,提取圖像特征的目的。

減少全連接層:因為全連接層需要將每個神經(jīng)元節(jié)點與其前后層的神經(jīng)元分別連接,其通常會占據(jù)卷積神經(jīng)網(wǎng)絡(luò)的大部分參數(shù)。為了減少模型的參數(shù),會盡量減少全連接層的使用,通常利用全劇平均池化或大尺寸卷積核取代全連接層,來融合學到的特征。

同時,為了讓模型能夠更好的提取人物面部的特征,專門的人臉識別網(wǎng)絡(luò)在這些方面進行了優(yōu)化,例如mobilefacenet在卷積網(wǎng)絡(luò)的尾部加入7*7卷積核壓縮特征圖,直接將特征圖轉(zhuǎn)化成相應(yīng)維度的面部特征并送入全連接層這樣的操作。對于一些特殊場景下的識別任務(wù),則會根據(jù)需求,定制出相應(yīng)的結(jié)構(gòu)模塊。例如,在面對面部遮擋的任務(wù)中,融入空間注意力機制,實現(xiàn)事先為特征熱力圖的空間分布的加權(quán),就變得相對重要。
編輯:lyn

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    門禁人臉識別:打造高效智能的人臉識別門禁考勤解決方案

    在物聯(lián)網(wǎng)與人工智能技術(shù)深度融合的今天,門禁管理與考勤統(tǒng)計作為場所安全與效率管理的核心環(huán)節(jié),正經(jīng)歷著從傳統(tǒng)模式向智能化的全面升級。門禁人臉識別技術(shù)的崛起,讓人臉
    的頭像 發(fā)表于 11-18 15:28 ?158次閱讀
    門禁<b class='flag-5'>人臉</b><b class='flag-5'>識別</b>:打造高效智能<b class='flag-5'>的人臉</b><b class='flag-5'>識別</b>門禁考勤解決方案

    基于級聯(lián)分類器的人臉檢測基本原理

    本次分享的內(nèi)容是基于級聯(lián)分類器的人臉檢測基本原理 1) 人臉檢測概述 關(guān)于人臉檢測算法,目前主流方法分為兩類,一類是基于知識,主要方法包括模板匹配,
    發(fā)表于 10-30 06:14

    如何挑選人臉識別終端?人臉識別一體機品牌排行榜

    考慮這些人臉識別終端的具體應(yīng)用場景在哪里。下面,小編就總結(jié)了2025年最新的人臉識別一體機品牌排行榜:一、海康威視人臉門禁一體機優(yōu)勢:采用先
    的頭像 發(fā)表于 08-18 10:44 ?1551次閱讀
    如何挑選<b class='flag-5'>人臉</b><b class='flag-5'>識別</b>終端?<b class='flag-5'>人臉</b><b class='flag-5'>識別</b>一體機品牌排行榜

    【Milk-V Duo S 開發(fā)板免費體驗】基于Duo S 使用 TDL SDK(V1版本)

    地將各種深度學習技術(shù)應(yīng)用于自己的產(chǎn)品和服務(wù)中。無論開發(fā)者是否是深度學習領(lǐng)域的專家,有了TDL SDK作為助手,都能輕松構(gòu)建智能應(yīng)用。 目前 TDL SDK 包含 移動偵測,
    發(fā)表于 08-10 22:09

    人臉方向識別算法

    人臉識別
    深蕾半導(dǎo)體
    發(fā)布于 :2025年07月22日 09:58:29

    基于LockAI視覺識別模塊:C++人臉識別

    是實現(xiàn)人臉識別的常用方法: 深度學習方法:現(xiàn)代的人臉識別系統(tǒng)大多采用
    發(fā)表于 07-01 12:01

    基于LockAI視覺識別模塊:C++人臉識別

    本文基于RV1106做成的LockAI視覺識別模塊,采用LZ-Picodet模型訓(xùn)練的人臉檢測模型LZ-Face,以及ArcFace人臉識別模型,實現(xiàn)
    的頭像 發(fā)表于 07-01 10:09 ?496次閱讀
    基于LockAI視覺<b class='flag-5'>識別</b>模塊:C++<b class='flag-5'>人臉</b><b class='flag-5'>識別</b>

    選擇戶外場景的人臉識別門禁一體機,需要具備哪些條件?

    我們常用于企業(yè)打卡或單位校園門禁的人臉識別身份核驗終端、刷臉核驗一體機、人臉識別門禁考勤機或人臉識別
    的頭像 發(fā)表于 06-09 10:26 ?730次閱讀
    選擇戶外場景<b class='flag-5'>的人臉</b><b class='flag-5'>識別</b>門禁一體機,需要具備哪些條件?

    基于RK3576開發(fā)板的人臉識別算法

    RK3576開發(fā)板展示人臉識別算法例程和API說明
    的頭像 發(fā)表于 05-07 16:48 ?2476次閱讀
    基于RK3576開發(fā)板<b class='flag-5'>的人臉</b><b class='flag-5'>識別</b><b class='flag-5'>算法</b>

    【幸狐Omni3576邊緣計算套件試用體驗】人臉識別

    RetinaFace 是帝國理工學院在 2019 年 5 月發(fā)表的論文中描述的人臉檢測算法,作者開源了相關(guān)代碼。 Retinaface 是一種單階段人臉檢測器,它通過聯(lián)合額外監(jiān)督和自監(jiān)督多任務(wù)
    發(fā)表于 04-01 21:46

    BP神經(jīng)網(wǎng)絡(luò)網(wǎng)絡(luò)結(jié)構(gòu)設(shè)計原則

    BP(back propagation)神經(jīng)網(wǎng)絡(luò)是一種按照誤差逆向傳播算法訓(xùn)練的多層前饋神經(jīng)網(wǎng)絡(luò),其網(wǎng)絡(luò)結(jié)構(gòu)設(shè)計原則主要基于以下幾個方面: 一、層次
    的頭像 發(fā)表于 02-12 16:41 ?1234次閱讀

    BP神經(jīng)網(wǎng)絡(luò)深度學習的關(guān)系

    ),是一種多層前饋神經(jīng)網(wǎng)絡(luò),它通過反向傳播算法進行訓(xùn)練。BP神經(jīng)網(wǎng)絡(luò)由輸入層、一個或多個隱藏層和輸出層組成,通過逐層遞減的方式調(diào)整網(wǎng)絡(luò)權(quán)重,目的是最小化
    的頭像 發(fā)表于 02-12 15:15 ?1330次閱讀

    人臉識別技術(shù)的優(yōu)勢與劣勢

    人臉識別技術(shù)的優(yōu)勢 1. 高度準確性 人臉識別技術(shù)在理想條件下可以達到非常高的準確性。隨著深度學習
    的頭像 發(fā)表于 02-06 18:23 ?3023次閱讀

    人臉識別技術(shù)的算法原理解析

    在數(shù)字化時代,人臉識別技術(shù)已經(jīng)成為身份驗證和安全監(jiān)控的重要手段。這項技術(shù)的核心在于算法,它們能夠從圖像中提取關(guān)鍵信息,并與數(shù)據(jù)庫中的信息進行匹配,以識別個體。 1.
    的頭像 發(fā)表于 02-06 17:50 ?2927次閱讀

    ElfBoard開源項目|百度智能云平臺的人臉識別項目

    百度智能云平臺的人臉識別項目,旨在利用其強大的人臉識別服務(wù)實現(xiàn)自動人臉識別。選擇百度智能云的原因
    的頭像 發(fā)表于 12-24 10:54 ?1822次閱讀
    ElfBoard開源項目|百度智能云平臺<b class='flag-5'>的人臉</b><b class='flag-5'>識別</b>項目