chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

語(yǔ)音識(shí)別的技術(shù)原理是什么?

九芯電子語(yǔ)音芯片 ? 2022-05-10 16:40 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

自動(dòng)語(yǔ)音辨認(rèn)技術(shù)(ASR,Automatic Speech Recognition)是一種經(jīng)過讓機(jī)器經(jīng)過辨認(rèn)和了解的過程,把人類的語(yǔ)音信號(hào)轉(zhuǎn)變?yōu)橄鄳?yīng)文本的技術(shù)。我們先來(lái)看看語(yǔ)音辨認(rèn)的歷史,其實(shí)早在計(jì)算機(jī)創(chuàng)造之前,有關(guān)ASR技術(shù)的理念就曾經(jīng)降生了,而早期的聲碼器就能夠被視為是語(yǔ)音辨認(rèn)及合成的雛形。而1920年代消費(fèi)的"Radio Rex"玩具狗,可能是早的語(yǔ)音辨認(rèn)器,當(dāng)這只狗的名字被召喚的時(shí)分,它可以從底座上彈出來(lái)。這么看來(lái)論輩分它是阿爾法狗的爺爺……但毫無(wú)疑問60年代計(jì)算機(jī)的開展推進(jìn)了語(yǔ)音辨認(rèn)技術(shù)技術(shù),這其中重要的一個(gè)里程碑就是動(dòng)態(tài)規(guī)劃技術(shù)(DP)和線性預(yù)測(cè)剖析技術(shù)(LP),后者又開展出了更成熟的動(dòng)態(tài)時(shí)間歸正技術(shù)(DTW),包括矢量量化(VQ)和隱馬爾可夫模型(HMM)理論。但這些還都只是單調(diào)又晦澀的算法,換句話說(shuō),工程師看到這些玩意也一頭霧水,基本沒方法疾速在應(yīng)用到理論里。所以在80年代時(shí),著名的AT&T Bell實(shí)驗(yàn)室經(jīng)過努力,把本來(lái)深?yuàn)W無(wú)比的HMM純數(shù)學(xué)模型工程化,為應(yīng)用開發(fā)打下了重要的基石。到90年代時(shí),深度神經(jīng)網(wǎng)絡(luò)技術(shù)的打破性開展,終于把語(yǔ)音辨認(rèn)技術(shù)本來(lái)的難關(guān)攻破了。所以在我們會(huì)發(fā)現(xiàn),從21世紀(jì)后語(yǔ)音辨認(rèn)技術(shù)的開展就疾速加快了。其實(shí)看起來(lái)高大上的語(yǔ)音辨認(rèn)技術(shù),原理并沒有多么復(fù)雜。不管是微軟家的Cortana、三星家的S-voice蘋果家的Siri,還是國(guó)內(nèi)一些獨(dú)立做語(yǔ)音辨認(rèn)的比方訊飛、Rokid,在原理在實(shí)質(zhì)上沒有幾差別:就是語(yǔ)音輸入后,停止特征提取,將提取的特征值放進(jìn)模型庫(kù)里,再不時(shí)地停止鍛煉和匹配,終解碼得到結(jié)果。

假如要細(xì)說(shuō)的話就比擬復(fù)雜了,比方模型庫(kù)中又分為聲學(xué)模型和言語(yǔ)模型。其中言語(yǔ)模型是依據(jù)不同品種的言語(yǔ),對(duì)詞串停止統(tǒng)計(jì)建模,目前普遍采用的是基于(n-1)階馬爾可夫鏈統(tǒng)計(jì)的n元語(yǔ)法模型。這里細(xì)致說(shuō)下聲學(xué)建模吧。首先經(jīng)過前端特征提取取得聲學(xué)特征,再進(jìn)一步對(duì)聲學(xué)特征停止統(tǒng)計(jì)建模。建模運(yùn)用到的貝葉斯統(tǒng)計(jì)建??蚣?,也就是大后驗(yàn)概率決策原則。這里算法這種深?yuàn)W的東西就不說(shuō)了,除非深度開發(fā),否則直接套用就行了,我本人也是博古通今,還是念書的時(shí)分學(xué)的。說(shuō)說(shuō)提取聲學(xué)特征該如何完成:當(dāng)語(yǔ)音輸入之后,首先停止模電轉(zhuǎn)換,將模仿信號(hào)轉(zhuǎn)變?yōu)?a target="_blank">數(shù)字信號(hào),再停止靜音切除去掉無(wú)關(guān)噪音,然后停止分幀。將此時(shí)的信號(hào)分紅一幀一幀之后(每一幀并不是獨(dú)立存在的而是相互關(guān)聯(lián)的),還要停止一系列的信號(hào)處置,包括預(yù)加重、加窗之后,再停止FFT變換之后,再經(jīng)過Mel參數(shù)的濾波和取對(duì)數(shù)、離散余弦變換等一系列算法處置后,能夠停止用梅爾頻率倒譜系數(shù)(MFCC)停止特征提取,得到聲學(xué)特征。覺得越說(shuō)越復(fù)雜了……后面簡(jiǎn)單點(diǎn)說(shuō)吧。前面說(shuō)了言語(yǔ)模型,而聲學(xué)模型就是將聲學(xué)特征統(tǒng)計(jì)建模后得到的。得到了模型庫(kù)之后就能夠停止模型鍛煉和形式匹配了。所謂模型鍛煉就是指依照一定的原則,從大量已知語(yǔ)音形式中獲取一個(gè)具特征的模型參數(shù)。而形式匹配則相反,是依據(jù)一定原則,將未知語(yǔ)音形式與模型庫(kù)中的某一個(gè)模型取得佳匹配后的解碼過程又能夠分紅動(dòng)態(tài)解碼網(wǎng)絡(luò)和靜態(tài)解碼網(wǎng)絡(luò)兩種:動(dòng)態(tài)網(wǎng)絡(luò)會(huì)編譯一個(gè)狀態(tài)網(wǎng)絡(luò)并構(gòu)成搜索空間,把單詞轉(zhuǎn)換成一個(gè)個(gè)的音素后將其依照語(yǔ)序拆分紅狀態(tài)序列,再依據(jù)音素上下文分歧性準(zhǔn)繩將狀態(tài)序列停止銜接。而靜態(tài)網(wǎng)絡(luò)普通是針對(duì)一些特殊詞(孤立詞)的辨認(rèn)網(wǎng)絡(luò),它的構(gòu)造就簡(jiǎn)單多了:先將每條特殊詞擴(kuò)展成HMM狀態(tài)序列,然后再計(jì)算得分,選擇得分大的作為辨認(rèn)輸出結(jié)果。由于靜態(tài)網(wǎng)絡(luò)是依據(jù)聲學(xué)概率計(jì)算權(quán)重,不需求查詢言語(yǔ)模型概率,因而解碼速度很快。 這樣的一個(gè)流程大致上就是語(yǔ)音辨認(rèn)技術(shù)的主要原理。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    瑞芯微(EASY EAI)RV1126B 語(yǔ)音識(shí)別

    1.語(yǔ)音識(shí)別簡(jiǎn)介語(yǔ)音識(shí)別技術(shù),也被稱為自動(dòng)語(yǔ)音識(shí)別
    的頭像 發(fā)表于 01-21 10:43 ?865次閱讀
    瑞芯微(EASY EAI)RV1126B <b class='flag-5'>語(yǔ)音</b><b class='flag-5'>識(shí)別</b>

    語(yǔ)音識(shí)別IC分類,語(yǔ)音識(shí)別芯片的工作原理

    語(yǔ)音識(shí)別芯片,也叫語(yǔ)音識(shí)別集成電路,是一種集聲音存儲(chǔ)、播放、錄音及語(yǔ)音識(shí)別功能于一體的專用芯片。
    的頭像 發(fā)表于 01-14 15:22 ?255次閱讀
    <b class='flag-5'>語(yǔ)音</b><b class='flag-5'>識(shí)別</b>IC分類,<b class='flag-5'>語(yǔ)音</b><b class='flag-5'>識(shí)別</b>芯片的工作原理

    華秋輸出的GERBER別的軟件無(wú)法正確識(shí)別

    ,卡住了。 這個(gè)是華秋識(shí)別的,可以看到是正確的。 下面是AD,KICAD、工廠錫膏機(jī)識(shí)別的,都一樣的,統(tǒng)一少了太多東東。
    發(fā)表于 12-17 10:46

    語(yǔ)音識(shí)別芯片有哪些(語(yǔ)音識(shí)別芯片AT680系列)

    在人工智能技術(shù)飛速發(fā)展的今天,語(yǔ)音識(shí)別芯片作為人機(jī)交互的重要橋梁,正逐漸成為各類智能設(shè)備不可或缺的核心部件。與傳統(tǒng)的語(yǔ)音芯片不同,語(yǔ)音
    的頭像 發(fā)表于 11-14 17:11 ?1397次閱讀

    什么是離線語(yǔ)音識(shí)別芯片(離線語(yǔ)音識(shí)別芯片有哪些優(yōu)點(diǎn))

    離線語(yǔ)音識(shí)別芯片,是一種集成了語(yǔ)音信號(hào)采集、前端處理和本地識(shí)別功能的專用集成電路,無(wú)須聯(lián)網(wǎng)也可以進(jìn)行語(yǔ)音控制。它內(nèi)設(shè)先進(jìn)的數(shù)字信號(hào)處理模塊及
    的頭像 發(fā)表于 10-31 15:27 ?528次閱讀

    如何選擇合適的語(yǔ)音識(shí)別芯片型號(hào)

    語(yǔ)音識(shí)別芯片(又稱語(yǔ)音識(shí)別IC)是現(xiàn)代智能設(shè)備的核心組件,與傳統(tǒng)語(yǔ)音芯片相比,其最大特點(diǎn)是能夠主動(dòng)識(shí)別
    的頭像 發(fā)表于 10-30 16:32 ?633次閱讀

    廣州唯創(chuàng)電子WTK6900H-32N語(yǔ)音識(shí)別芯片:AI降噪算法助力抽油煙機(jī)精準(zhǔn)語(yǔ)音控制 | 語(yǔ)音IC廠家

    在現(xiàn)代智能家居快速發(fā)展的大背景下,廚房作為家庭生活的重要場(chǎng)景,其智能化程度卻一直受到環(huán)境噪音的制約。抽油煙機(jī)作為廚房核心電器,其運(yùn)行產(chǎn)生的噪音往往使得傳統(tǒng)語(yǔ)音識(shí)別技術(shù)難以發(fā)揮效用。廣州唯創(chuàng)電子憑借其
    的頭像 發(fā)表于 10-30 09:17 ?403次閱讀
    廣州唯創(chuàng)電子WTK6900H-32N<b class='flag-5'>語(yǔ)音</b><b class='flag-5'>識(shí)別</b>芯片:AI降噪算法助力抽油煙機(jī)精準(zhǔn)<b class='flag-5'>語(yǔ)音</b>控制 | <b class='flag-5'>語(yǔ)音</b>IC廠家

    語(yǔ)音識(shí)別系統(tǒng)的技術(shù)核心:從聲音到文字的智能轉(zhuǎn)換

    ? ? ? 語(yǔ)音識(shí)別技術(shù),也稱為自動(dòng)語(yǔ)音識(shí)別(ASR),其核心目標(biāo)是將人類語(yǔ)音信號(hào)轉(zhuǎn)換為對(duì)應(yīng)的文
    的頭像 發(fā)表于 09-05 14:04 ?859次閱讀

    基于開源鴻蒙的語(yǔ)音識(shí)別語(yǔ)音合成應(yīng)用開發(fā)樣例

    本期內(nèi)容由AI Model SIG提供,介紹了在開源鴻蒙中,利用sherpa_onnx開源三方庫(kù)進(jìn)行ASR語(yǔ)音識(shí)別與TTS語(yǔ)音合成應(yīng)用開發(fā)的流程。
    的頭像 發(fā)表于 08-25 14:26 ?4142次閱讀
    基于開源鴻蒙的<b class='flag-5'>語(yǔ)音</b><b class='flag-5'>識(shí)別</b>及<b class='flag-5'>語(yǔ)音</b>合成應(yīng)用開發(fā)樣例

    瑞芯微RK3576語(yǔ)音識(shí)別算法

    1.語(yǔ)音識(shí)別簡(jiǎn)介語(yǔ)音識(shí)別技術(shù),也被稱為自動(dòng)語(yǔ)音識(shí)別
    的頭像 發(fā)表于 08-15 15:13 ?2203次閱讀
    瑞芯微RK3576<b class='flag-5'>語(yǔ)音</b><b class='flag-5'>識(shí)別</b>算法

    語(yǔ)音識(shí)別---大家怎么看呢?

    語(yǔ)音識(shí)別是一門交叉學(xué)科。近二十年來(lái),語(yǔ)音識(shí)別技術(shù)取得顯著進(jìn)步,開始從實(shí)驗(yàn)室走向市場(chǎng)。人們預(yù)計(jì),未來(lái)10年內(nèi),
    發(fā)表于 08-09 10:54

    語(yǔ)音識(shí)別芯片選型有哪些技術(shù)參數(shù)要注意

    語(yǔ)音識(shí)別芯片的使用場(chǎng)景越來(lái)越多涉及的范圍也越來(lái)越廣!那么語(yǔ)音芯片的選型就很重要了,選型不對(duì)直接影響產(chǎn)品的使用體驗(yàn),下面小編從不同的維度來(lái)給大家介紹語(yǔ)音
    的頭像 發(fā)表于 06-23 17:31 ?889次閱讀
    <b class='flag-5'>語(yǔ)音</b><b class='flag-5'>識(shí)別</b>芯片選型有哪些<b class='flag-5'>技術(shù)</b>參數(shù)要注意

    明遠(yuǎn)智睿SSD2351開發(fā)板:語(yǔ)音機(jī)器人領(lǐng)域的變革力量

    ,提高語(yǔ)音識(shí)別的準(zhǔn)確率;同時(shí)也可連接高質(zhì)量的揚(yáng)聲器,確保語(yǔ)音合成后的聲音清晰、自然。TF卡接口能夠存儲(chǔ)大量的語(yǔ)音數(shù)據(jù)、對(duì)話模型以及語(yǔ)音機(jī)器人
    發(fā)表于 05-28 11:36

    普強(qiáng)信息入選2024語(yǔ)音識(shí)別技術(shù)公司TOP30榜單

    普強(qiáng)憑借在語(yǔ)音識(shí)別領(lǐng)域多年的技術(shù)積淀與持續(xù)的創(chuàng)新突破,成功入選“2024語(yǔ)音識(shí)別技術(shù)公司TOP3
    的頭像 發(fā)表于 04-18 17:25 ?1229次閱讀

    廠家芯資訊|廣州唯創(chuàng)電子語(yǔ)音識(shí)別芯片技術(shù)解析

    ?一、公司及產(chǎn)品概述作為國(guó)內(nèi)領(lǐng)先的語(yǔ)音芯片研發(fā)企業(yè),深耕語(yǔ)音技術(shù)領(lǐng)域25年,其產(chǎn)品以高穩(wěn)定性、低功耗和多場(chǎng)景適應(yīng)性著稱。公司推出的語(yǔ)音識(shí)別
    的頭像 發(fā)表于 03-19 08:46 ?821次閱讀
    廠家芯資訊|廣州唯創(chuàng)電子<b class='flag-5'>語(yǔ)音</b><b class='flag-5'>識(shí)別</b>芯片<b class='flag-5'>技術(shù)</b>解析