chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

什么是聲紋?聲紋識別的原理是什么?

MEMS ? 來源:楊湘祁 ? 作者:電子發(fā)燒友 ? 2019-03-11 09:16 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

一、什么是聲紋?

聲紋(Voiceprint),是用電聲學(xué)儀器顯示的攜帶言語信息的聲波頻譜,是由波長、頻率以及強度等百余種特征維度組成的生物特征,具有穩(wěn)定性、可測量性、唯一性等特點。

人類語言的產(chǎn)生是人體語言中樞與發(fā)音器官之間一個復(fù)雜的生理物理過程,發(fā)聲器官–舌、牙齒、喉頭、肺、鼻腔在尺寸和形態(tài)方面每個人的差異很大,所以任何兩個人的聲紋圖譜都有差異。

每個人的語音聲學(xué)特征既有相對穩(wěn)定性,又有變異性,不是一成不變的。這種變異可來自生理、病理、心理、模擬、偽裝,也與環(huán)境干擾有關(guān)。

盡管如此,由于每個人的發(fā)音器官都不盡相同,因此在一般情況下,人們?nèi)阅軈^(qū)別不同的人的聲音或判斷是否是同一人的聲音。

聲紋不如圖像那樣直觀展現(xiàn),在實際分析中,可通過波形圖和語譜圖進行展現(xiàn),如下所示:

二、聲紋識別的原理

人在講話時使用的發(fā)聲器官在尺寸和形態(tài)方面每個人的差異很大,所以任何兩個人的聲紋圖譜都有差異,主要體現(xiàn)在如下方面:

共鳴方式特征:咽腔共鳴、鼻腔共鳴和口腔共鳴

嗓音純度特征:不同人的嗓音,純度一般是不一樣的,粗略地可分為高純度(明亮)、低純度(沙?。┖椭械燃兌热齻€等級

平均音高特征:平均音高的高低就是一般所說的嗓音是高亢還是低沉

音域特征:音域的高低就是通常所說的聲音飽滿還是干癟

不同人的聲音在語譜圖中共振峰的分布情況不同,聲紋識別正是通過比對兩段語音的說話人在相同音素上的發(fā)聲來判斷是否為同一個人,從而實現(xiàn)“聞聲識人”的功能。

三、聲紋識別算法的技術(shù)指標(biāo)

聲紋識別在算法層面可通過如下基本的技術(shù)指標(biāo)來判斷其性能,除此之外還有其它的一些指標(biāo),如:信道魯棒性、時變魯棒性、假冒攻擊魯棒性、群體普適性等指標(biāo),這部分后續(xù)于詳細展開講解。

錯誤拒絕率(False Rejection Rate, FRR):分類問題中,若兩個樣本為同類(同一個人),卻被系統(tǒng)誤認為異類(非同一個人),則為錯誤拒絕案例。錯誤拒絕率為錯誤拒絕案例在所有同類匹配案例的比例。

錯誤接受率(False Acceptance Rate, FAR) :分類問題中,若兩個樣本為異類(非同一個人),卻被系統(tǒng)誤認為同類(同一個人),則為錯誤接受案例。錯誤接受率為錯誤接受案例在所有異類匹配案例的比例。

等錯誤率(Equal Error Rate,EER):調(diào)整閾值,使得誤拒絕率(False Rejection Rate,F(xiàn)RR)等于誤接受率(False Acceptance Rate,F(xiàn)AR),此時的FAR與FRR的值稱為等錯誤率。

準(zhǔn)確率(Accuracy,ACC):調(diào)整閾值,使得FAR+FRR最小,1減去這個值即為識別準(zhǔn)確率,即ACC=1 – min(FAR+FRR)

速度:(提取速度:提取聲紋速度與音頻時長有關(guān)、驗證比對速度):Real Time Factor 實時比(衡量提取時間跟音頻時長的關(guān)系,比如:1秒能夠處理80s的音頻,那么實時比就是1:80)。驗證比對速度是指平均每秒鐘能進行的聲紋比對次數(shù)。

ROC曲線:描述FAR與FRR之間相互變化關(guān)系的曲線,X軸為FAR的值,Y軸為FRR的值。從左到右,當(dāng)閾值增長期間,每一個時刻都有一對FAR和FRR的值,將這些值在圖上描點連成一條曲線,就是ROC曲線。

閾值:在接受/拒絕二元分類系統(tǒng)中,通常會設(shè)定一個閾值,分數(shù)超過該值時才做出接受決定。調(diào)節(jié)閾值可以根據(jù)業(yè)務(wù)需求平衡FAR與FRR。 當(dāng)設(shè)定高閾值時,系統(tǒng)做出接受決定的得分要求較為嚴格,F(xiàn)AR降低,F(xiàn)RR升高;當(dāng)設(shè)定低閾值時,系統(tǒng)做出接受決定的得分要求較為寬松,F(xiàn)AR升高,F(xiàn)RR降低。在不同應(yīng)用場景下,調(diào)整不同的閾值,則可在安全性和方便性間平平衡,如下圖所示:

四、影響聲紋識別水平的因素

訓(xùn)練數(shù)據(jù)和算法是影響聲紋識別水平的兩個重要因素,在應(yīng)用落地過程中,還會受很多因素的影響。

聲源采樣率:

人類語音的頻段集中于50Hz ~ 8KHz之間,尤其在4KHz以下頻段

離散信號覆蓋頻段為信號采樣率的一半(奈奎斯特采樣定理)。

采樣率越高,信息量越大。

常用采樣率:8KHz(即0 ~ 4KHz頻段),16KHz(即0 ~ 8KHz頻段)。

信噪比(SNR):

信噪比衡量一段音頻中語音信號與噪聲的能量比,即語音的干凈程度:

15dB以上(基本干凈)

6dB(嘈雜)

0dB(非常吵)

信道:

不同的采集設(shè)備,以及通信過程會引入不同的失真。

聲紋識別算法與模型需要覆蓋盡可能多的信道。

手機麥克風(fēng)、桌面麥克風(fēng)、固話、移動通信(CDMA, TD-LTE等)、微信……

語音時長:

語音時長(包括注冊語音條數(shù))會影響聲紋識別的精度。

有效語音時長越長,算法得到的數(shù)據(jù)越多,精度也會越高。

短語音(1~3s)

長語音(20s+)

文本內(nèi)容:

通俗地說,聲紋識別系統(tǒng)通過比對兩段語音的說話人在相同音素上的發(fā)聲來判斷是否為同一個人。

固定文本:注冊與驗證內(nèi)容相同

半固定文本:內(nèi)容一樣但順序不同;文本屬于固定集合

自由文本

五、聲紋識別的應(yīng)用流程

聲紋識別(VPR) ,生物識別技術(shù)的一種,也稱為說話人識別 ,是從說話人發(fā)出的語音信號中提取聲紋信息。

從應(yīng)用上看,可分為:

說話人辨認(Speaker Identification):用以判斷某段語音是若干人中的哪一個所說的,是“多選一”問題;

說話人確認(Speaker Verification):用以確認某段語音是否是指定的某個人所說的,是“一對一判別”問題。

聲紋識別在應(yīng)用中分注冊和驗證兩個主流程,根據(jù)不同的應(yīng)用中,部分處理流程會存在差異,一般的聲紋識別應(yīng)用流程如下圖所示:

六、聲紋識別的應(yīng)用場景

聲紋識別作為生物識別技術(shù)的一種,有非常多好的應(yīng)用場景,根據(jù)聲音的特性,下面從公共安全、金融、社保、智能硬件四個領(lǐng)域介紹聲紋識別的應(yīng)用。

1. 公安領(lǐng)域

聲紋作為一種生物特征,最早在刑偵和鑒識領(lǐng)域成功應(yīng)用。

近年來,由于互聯(lián)網(wǎng)的發(fā)展,語音案件也呈現(xiàn)出井噴的趨勢,在這些語音案件中,聲紋識別成了唯一一種有效的技術(shù)偵破手段,通過的聲紋識別和聲紋大數(shù)據(jù)技術(shù)進行重點人員監(jiān)管、反電信詐騙、反恐、刑事案件偵破、身份查詢與核驗,助力公安有效遏制與打擊犯罪,構(gòu)建和強化安全的社會公眾環(huán)境。

2. 金融

針對銀行、互聯(lián)網(wǎng)金融等各類金融及服務(wù)機構(gòu),通過聲紋識別技術(shù),提供了用戶注冊、遠程驗證、金融生物識別解決方案,大幅提高金融機構(gòu)的風(fēng)險防范系統(tǒng)安全性,強化風(fēng)控能力,增加用戶的安全性,防范身份欺詐。

另外在電話客服系統(tǒng)中,通過聲紋識別技術(shù),可實時識別出用戶的身份,從而提供個性化的客戶服務(wù)。

3. 社保

我國針對離退休人員,每年至少需要進行一次生存狀態(tài)驗證,并以此為依據(jù)進行養(yǎng)老金的發(fā)放,目前可通過到指定社保大廳或自助終端進行生存驗證,對于一些行動不便的老人家,這種方式也是非常不便利。

聲紋識別技術(shù)在遠程身份驗證中有著天然的優(yōu)勢,只需要一個電話(手機或固話都可以),即可完成生存驗證,為參保人員提供了便利,同時也為國家節(jié)省大量成本,避免養(yǎng)老金流失。

4. 智能硬件

在智能硬件產(chǎn)品中,聲紋識別解決了當(dāng)前智能產(chǎn)品只能識別用戶所說的內(nèi)容,而不能區(qū)分說話人身份的問題,讓智能產(chǎn)品能夠區(qū)分不同的角色,實現(xiàn)“聽聲識人”。

讓系統(tǒng)針對性對每個人提供不同的內(nèi)容與服務(wù),讓人機交互更加簡單,讓用戶享受更輕松、更具個性化、更安全的產(chǎn)品體驗。

七、總結(jié)

聲紋識別作為最前沿的生物識別技術(shù),隨著技術(shù)的成熟,將會在越來越多的應(yīng)用場景下落地。

我們相信:在不久的將來,在第三代身份證上,聲紋將成為繼指紋、人像后又一個新增的公民身份ID。

聲音將在我們未來的科技生活中扮演眼越來越重要的角色。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 聲紋識別
    +關(guān)注

    關(guān)注

    3

    文章

    143

    瀏覽量

    22311
  • 聲紋
    +關(guān)注

    關(guān)注

    0

    文章

    26

    瀏覽量

    4531

原文標(biāo)題:人工智能老司機帶你認識聲音黑科技:聲紋識別

文章出處:【微信號:MEMSensor,微信公眾號:MEMS】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    變壓器智能聲紋傳感器:聲波解碼設(shè)備健康

    文章由山東華科信息技術(shù)有限公司提供在電力系統(tǒng)中,變壓器作為電能轉(zhuǎn)換與傳輸?shù)暮诵脑O(shè)備,其運行狀態(tài)直接影響電網(wǎng)安全與供電質(zhì)量。傳統(tǒng)運維依賴人工聽音、定期停電檢測,難以捕捉早期微小缺陷。變壓器智能聲紋
    的頭像 發(fā)表于 01-04 15:21 ?148次閱讀
    變壓器智能<b class='flag-5'>聲紋</b>傳感器:聲波解碼設(shè)備健康

    配電房自適應(yīng)濾波聲紋傳感器:智能監(jiān)測的新維度

    文章由山東華科信息技術(shù)有限公司提供在配電房的日常運維中,設(shè)備運行聲音的細微變化往往蘊含著潛在故障的早期信號。自適應(yīng)濾波聲紋傳感器作為新一代智能監(jiān)測設(shè)備,通過動態(tài)捕捉與分析設(shè)備聲紋特征,為電力系統(tǒng)
    的頭像 發(fā)表于 11-18 09:17 ?281次閱讀
    配電房自適應(yīng)濾波<b class='flag-5'>聲紋</b>傳感器:智能監(jiān)測的新維度

    油浸變壓器聲紋傳感器:以聲紋特征識別為核心的智能監(jiān)測方案

    文章由山東華科信息技術(shù)有限公司提供在電力設(shè)備狀態(tài)監(jiān)測領(lǐng)域,油浸變壓器作為電網(wǎng)核心設(shè)備,其運行安全直接影響電力系統(tǒng)穩(wěn)定性。聲紋傳感器通過捕捉設(shè)備運行時的聲紋特征,實現(xiàn)對變壓器內(nèi)部異常狀態(tài)的精準(zhǔn)識別
    的頭像 發(fā)表于 11-04 09:25 ?416次閱讀
    油浸變壓器<b class='flag-5'>聲紋</b>傳感器:以<b class='flag-5'>聲紋</b>特征<b class='flag-5'>識別</b>為核心的智能監(jiān)測方案

    油浸變壓器聲紋監(jiān)測:以聲音守護設(shè)備健康

    文章由山東華科信息技術(shù)有限公司提供在電力系統(tǒng)中,油浸變壓器作為能量轉(zhuǎn)換與傳輸?shù)暮诵脑O(shè)備,其運行狀態(tài)直接影響電網(wǎng)的穩(wěn)定性與安全性。聲紋監(jiān)測技術(shù)通過捕捉設(shè)備運行時的聲音特征,實現(xiàn)對潛在故障的早期預(yù)警
    的頭像 發(fā)表于 10-29 09:07 ?358次閱讀
    油浸變壓器<b class='flag-5'>聲紋</b>監(jiān)測:以聲音守護設(shè)備健康

    工業(yè)配電房濾波聲紋傳感器的技術(shù)解析與運維價值

    文章由山東華科信息技術(shù)有限公司提供在工業(yè)配電房設(shè)備狀態(tài)監(jiān)測領(lǐng)域,濾波聲紋傳感器作為新興的聲學(xué)感知技術(shù),正逐步成為設(shè)備運維的關(guān)鍵工具。該技術(shù)通過捕捉設(shè)備運行中的聲紋特征,結(jié)合信號濾波與模式識別算法
    的頭像 發(fā)表于 10-17 09:12 ?295次閱讀
    工業(yè)配電房濾波<b class='flag-5'>聲紋</b>傳感器的技術(shù)解析與運維價值

    調(diào)壓變壓器聲紋監(jiān)測:電力設(shè)備健康管理的“聲波密碼”

    文章由山東華科信息技術(shù)有限公司提供在電力系統(tǒng)中,調(diào)壓變壓器作為電壓調(diào)節(jié)的核心設(shè)備,其運行狀態(tài)直接影響電網(wǎng)穩(wěn)定性。傳統(tǒng)監(jiān)測手段多依賴電氣參數(shù)分析,而聲紋監(jiān)測作為一種非侵入式、高靈敏度的檢測技術(shù),正逐步
    的頭像 發(fā)表于 09-24 09:33 ?474次閱讀
    調(diào)壓變壓器<b class='flag-5'>聲紋</b>監(jiān)測:電力設(shè)備健康管理的“聲波密碼”

    配電房自適應(yīng)濾波聲紋傳感器

    了"智能耳朵",實現(xiàn)了從被動響應(yīng)到主動預(yù)防的運維模式革新。該技術(shù)的核心在于自適應(yīng)濾波與聲紋識別的深度結(jié)合。傳感器內(nèi)置的數(shù)字信號處理器可實時分析環(huán)境噪聲特征,通過LMS算法動
    的頭像 發(fā)表于 08-08 09:36 ?839次閱讀
    配電房自適應(yīng)濾波<b class='flag-5'>聲紋</b>傳感器

    開關(guān)柜體動態(tài)聲紋特征分析系統(tǒng):電力設(shè)備狀態(tài)感知的“聽覺維度”

    文章由山東華科信息技術(shù)有限公司提供在電力設(shè)備運維領(lǐng)域,聲音作為設(shè)備運行狀態(tài)的"天然指紋",正成為狀態(tài)監(jiān)測的重要維度。開關(guān)柜體動態(tài)聲紋特征分析系統(tǒng)通過捕捉設(shè)備運行時的聲音特征,為運
    的頭像 發(fā)表于 07-10 10:54 ?611次閱讀
    開關(guān)柜體動態(tài)<b class='flag-5'>聲紋</b>特征分析系統(tǒng):電力設(shè)備狀態(tài)感知的“聽覺維度”

    開關(guān)柜體振動聲紋監(jiān)測設(shè)備技術(shù)解析

    文章由山東華科信息技術(shù)有限公司提供開關(guān)柜作為電力分配與控制的核心設(shè)備,其運行狀態(tài)直接影響電網(wǎng)穩(wěn)定性。傳統(tǒng)巡檢方式難以捕捉早期機械故障,振動聲紋監(jiān)測技術(shù)通過解析設(shè)備運行產(chǎn)生的振動與聲音信號,為狀態(tài)評估
    的頭像 發(fā)表于 07-03 10:08 ?722次閱讀
    開關(guān)柜體振動<b class='flag-5'>聲紋</b>監(jiān)測設(shè)備技術(shù)解析

    聲紋解鎖個性化!啟明云端硅思物語AI平臺讓設(shè)備“認準(zhǔn)你的聲音”

    啟明云端依托旗下硅思物語AI平臺,通過聲紋采集技術(shù),在ESP32-S3潮玩手辦伴侶上構(gòu)建的個性化智能助手的真實落地應(yīng)用場景。聲紋采集:你的聲音就是“生物密碼”什么是聲紋?聲紋如同指
    的頭像 發(fā)表于 06-17 18:02 ?1373次閱讀
    <b class='flag-5'>聲紋</b>解鎖個性化!啟明云端硅思物語AI平臺讓設(shè)備“認準(zhǔn)你的聲音”

    電網(wǎng)運維動態(tài)聲紋特征分析系統(tǒng):聆聽設(shè)備“心跳”的智能守護者

    文章由山東華科信息技術(shù)有限公司提供在電網(wǎng)智能化轉(zhuǎn)型的浪潮中,設(shè)備運維模式正經(jīng)歷深刻變革。傳統(tǒng)人工巡檢依賴經(jīng)驗判斷,難以捕捉設(shè)備早期隱性故障。動態(tài)聲紋特征分析系統(tǒng)通過解析設(shè)備運行聲紋,為電網(wǎng)運維裝上
    的頭像 發(fā)表于 05-13 09:44 ?714次閱讀
    電網(wǎng)運維動態(tài)<b class='flag-5'>聲紋</b>特征分析系統(tǒng):聆聽設(shè)備“心跳”的智能守護者

    電機軸承聲紋傳感器:工業(yè)設(shè)備健康的“聲波偵探”

    引發(fā)故障。傳統(tǒng)人工聽診或定期停機檢測方式存在效率低、盲區(qū)大等問題,電機軸承聲紋傳感器的出現(xiàn),為設(shè)備健康管理提供了智能化解決方案。聲紋監(jiān)測:捕捉軸承的“語言”電機軸
    的頭像 發(fā)表于 05-13 09:43 ?1130次閱讀
    電機軸承<b class='flag-5'>聲紋</b>傳感器:工業(yè)設(shè)備健康的“聲波偵探”

    智能電力聲紋監(jiān)測系統(tǒng):守護電網(wǎng)安全的“聲紋衛(wèi)士”

    文章由山東華科信息技術(shù)有限公司提供在科技日新月異的今天,電力系統(tǒng)的智能化轉(zhuǎn)型已成為行業(yè)發(fā)展的必然趨勢。其中,智能電力聲紋監(jiān)測系統(tǒng)作為一種創(chuàng)新的監(jiān)測技術(shù),正逐步成為守護電網(wǎng)安全的重要工具。2025年
    的頭像 發(fā)表于 04-23 09:32 ?1128次閱讀
    智能電力<b class='flag-5'>聲紋</b>監(jiān)測系統(tǒng):守護電網(wǎng)安全的“<b class='flag-5'>聲紋</b>衛(wèi)士”

    京朗仕特工業(yè)聲紋檢測設(shè)備支持定向拾音

    的一款將收集到的聲紋轉(zhuǎn)換成可視化圖像的設(shè)備,以便幫助工作人員識別各種設(shè)備發(fā)出的聲紋和氣體泄漏的聲紋,用以判斷被檢測設(shè)備運行狀態(tài)是否正常,或是設(shè)備、管道等是否存在氣體
    的頭像 發(fā)表于 03-05 14:43 ?778次閱讀
    京朗仕特工業(yè)<b class='flag-5'>聲紋</b>檢測設(shè)備支持定向拾音

    新品| Unit ASR,一體化離線語音識別單元

    UnitASR是一款A(yù)I語音識別單元,內(nèi)置AI智能離線語音模塊CI-03T。它具有語音識別聲紋識別、語音增強和語音檢測等多項功能,同時支持回聲消除(AEC),有效減少噪聲和回聲干擾,確保語音
    的頭像 發(fā)表于 02-14 18:34 ?836次閱讀
    新品| Unit ASR,一體化離線語音<b class='flag-5'>識別</b>單元