chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

語音識別的技術原理是什么?

九芯電子語音芯片 ? 2022-05-10 16:40 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

自動語音辨認技術(ASR,Automatic Speech Recognition)是一種經過讓機器經過辨認和了解的過程,把人類的語音信號轉變?yōu)橄鄳谋镜募夹g。我們先來看看語音辨認的歷史,其實早在計算機創(chuàng)造之前,有關ASR技術的理念就曾經降生了,而早期的聲碼器就能夠被視為是語音辨認及合成的雛形。而1920年代消費的"Radio Rex"玩具狗,可能是早的語音辨認器,當這只狗的名字被召喚的時分,它可以從底座上彈出來。這么看來論輩分它是阿爾法狗的爺爺……但毫無疑問60年代計算機的開展推進了語音辨認技術技術,這其中重要的一個里程碑就是動態(tài)規(guī)劃技術(DP)和線性預測剖析技術(LP),后者又開展出了更成熟的動態(tài)時間歸正技術(DTW),包括矢量量化(VQ)和隱馬爾可夫模型(HMM)理論。但這些還都只是單調又晦澀的算法,換句話說,工程師看到這些玩意也一頭霧水,基本沒方法疾速在應用到理論里。所以在80年代時,著名的AT&T Bell實驗室經過努力,把本來深奧無比的HMM純數學模型工程化,為應用開發(fā)打下了重要的基石。到90年代時,深度神經網絡技術的打破性開展,終于把語音辨認技術本來的難關攻破了。所以在我們會發(fā)現,從21世紀后語音辨認技術的開展就疾速加快了。其實看起來高大上的語音辨認技術,原理并沒有多么復雜。不管是微軟家的Cortana、三星家的S-voice蘋果家的Siri,還是國內一些獨立做語音辨認的比方訊飛、Rokid,在原理在實質上沒有幾差別:就是語音輸入后,停止特征提取,將提取的特征值放進模型庫里,再不時地停止鍛煉和匹配,終解碼得到結果。

假如要細說的話就比擬復雜了,比方模型庫中又分為聲學模型和言語模型。其中言語模型是依據不同品種的言語,對詞串停止統計建模,目前普遍采用的是基于(n-1)階馬爾可夫鏈統計的n元語法模型。這里細致說下聲學建模吧。首先經過前端特征提取取得聲學特征,再進一步對聲學特征停止統計建模。建模運用到的貝葉斯統計建??蚣埽簿褪谴蠛篁灨怕蕸Q策原則。這里算法這種深奧的東西就不說了,除非深度開發(fā),否則直接套用就行了,我本人也是博古通今,還是念書的時分學的。說說提取聲學特征該如何完成:當語音輸入之后,首先停止模電轉換,將模仿信號轉變?yōu)?a target="_blank">數字信號,再停止靜音切除去掉無關噪音,然后停止分幀。將此時的信號分紅一幀一幀之后(每一幀并不是獨立存在的而是相互關聯的),還要停止一系列的信號處置,包括預加重、加窗之后,再停止FFT變換之后,再經過Mel參數的濾波和取對數、離散余弦變換等一系列算法處置后,能夠停止用梅爾頻率倒譜系數(MFCC)停止特征提取,得到聲學特征。覺得越說越復雜了……后面簡單點說吧。前面說了言語模型,而聲學模型就是將聲學特征統計建模后得到的。得到了模型庫之后就能夠停止模型鍛煉和形式匹配了。所謂模型鍛煉就是指依照一定的原則,從大量已知語音形式中獲取一個具特征的模型參數。而形式匹配則相反,是依據一定原則,將未知語音形式與模型庫中的某一個模型取得佳匹配后的解碼過程又能夠分紅動態(tài)解碼網絡和靜態(tài)解碼網絡兩種:動態(tài)網絡會編譯一個狀態(tài)網絡并構成搜索空間,把單詞轉換成一個個的音素后將其依照語序拆分紅狀態(tài)序列,再依據音素上下文分歧性準繩將狀態(tài)序列停止銜接。而靜態(tài)網絡普通是針對一些特殊詞(孤立詞)的辨認網絡,它的構造就簡單多了:先將每條特殊詞擴展成HMM狀態(tài)序列,然后再計算得分,選擇得分大的作為辨認輸出結果。由于靜態(tài)網絡是依據聲學概率計算權重,不需求查詢言語模型概率,因而解碼速度很快。 這樣的一個流程大致上就是語音辨認技術的主要原理。

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規(guī)問題,請聯系本站處理。 舉報投訴
  • 語音識別
    +關注

    關注

    39

    文章

    1804

    瀏覽量

    115579
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    語音識別芯片有哪些(語音識別芯片AT680系列)

    在人工智能技術飛速發(fā)展的今天,語音識別芯片作為人機交互的重要橋梁,正逐漸成為各類智能設備不可或缺的核心部件。與傳統的語音芯片不同,語音
    的頭像 發(fā)表于 11-14 17:11 ?1037次閱讀

    什么是離線語音識別芯片(離線語音識別芯片有哪些優(yōu)點)

    離線語音識別芯片,是一種集成了語音信號采集、前端處理和本地識別功能的專用集成電路,無須聯網也可以進行語音控制。它內設先進的數字信號處理模塊及
    的頭像 發(fā)表于 10-31 15:27 ?284次閱讀

    如何選擇合適的語音識別芯片型號

    語音識別芯片(又稱語音識別IC)是現代智能設備的核心組件,與傳統語音芯片相比,其最大特點是能夠主動識別
    的頭像 發(fā)表于 10-30 16:32 ?469次閱讀

    瑞芯微RK3576語音識別算法

    1.語音識別簡介語音識別技術,也被稱為自動語音識別
    的頭像 發(fā)表于 08-15 15:13 ?1869次閱讀
    瑞芯微RK3576<b class='flag-5'>語音</b><b class='flag-5'>識別</b>算法

    語音識別---大家怎么看呢?

    語音識別是一門交叉學科。近二十年來,語音識別技術取得顯著進步,開始從實驗室走向市場。人們預計,未來10年內,
    發(fā)表于 08-09 10:54

    語音識別芯片選型有哪些技術參數要注意

    語音識別芯片的使用場景越來越多涉及的范圍也越來越廣!那么語音芯片的選型就很重要了,選型不對直接影響產品的使用體驗,下面小編從不同的維度來給大家介紹語音
    的頭像 發(fā)表于 06-23 17:31 ?683次閱讀
    <b class='flag-5'>語音</b><b class='flag-5'>識別</b>芯片選型有哪些<b class='flag-5'>技術</b>參數要注意

    明遠智睿SSD2351開發(fā)板:語音機器人領域的變革力量

    ,提高語音識別的準確率;同時也可連接高質量的揚聲器,確保語音合成后的聲音清晰、自然。TF卡接口能夠存儲大量的語音數據、對話模型以及語音機器人
    發(fā)表于 05-28 11:36

    普強信息入選2024語音識別技術公司TOP30榜單

    普強憑借在語音識別領域多年的技術積淀與持續(xù)的創(chuàng)新突破,成功入選“2024語音識別技術公司TOP3
    的頭像 發(fā)表于 04-18 17:25 ?1010次閱讀

    廠家芯資訊|廣州唯創(chuàng)電子語音識別芯片技術解析

    ?一、公司及產品概述作為國內領先的語音芯片研發(fā)企業(yè),深耕語音技術領域25年,其產品以高穩(wěn)定性、低功耗和多場景適應性著稱。公司推出的語音識別
    的頭像 發(fā)表于 03-19 08:46 ?653次閱讀
    廠家芯資訊|廣州唯創(chuàng)電子<b class='flag-5'>語音</b><b class='flag-5'>識別</b>芯片<b class='flag-5'>技術</b>解析

    語音識別技術在通信領域中的應用實例

    語音識別技術也被稱為自動語音識別(Automatic Speech Recognition,ASR),是通過計算機對
    的頭像 發(fā)表于 02-21 17:12 ?1077次閱讀

    詳解語音識別技術在通信領域中的應用

    語音識別技術也被稱為自動語音識別(Automatic Speech Recognition,ASR),是通過計算機對
    的頭像 發(fā)表于 02-21 17:05 ?1035次閱讀
    詳解<b class='flag-5'>語音</b><b class='flag-5'>識別</b><b class='flag-5'>技術</b>在通信領域中的應用

    新品| Unit ASR,一體化離線語音識別單元

    UnitASR是一款AI語音識別單元,內置AI智能離線語音模塊CI-03T。它具有語音識別、聲紋識別
    的頭像 發(fā)表于 02-14 18:34 ?756次閱讀
    新品| Unit ASR,一體化離線<b class='flag-5'>語音</b><b class='flag-5'>識別</b>單元

    【「嵌入式系統設計與實現」閱讀體驗】+ 基于語音識別的智能杯墊

    語音命令Q 識別,適用于智能家居控制、玩具、人機交互等多個領域。該模塊以其高識別率、低功耗和易于集成的特點受到廣大開發(fā)者的青睞。 主要技術及功能有: 磁力攪拌、重量采集、
    發(fā)表于 01-02 18:15

    離線語音識別技術引領智能語音燈具市場——NRK3502

    智能語音燈具集高科技與人性化設計,內置NRK3502離線語音識別芯片,支持遠場識別與自定義指令,提供便捷智能體驗,推動智能家居行業(yè)發(fā)展。
    的頭像 發(fā)表于 12-30 15:04 ?1225次閱讀
    離線<b class='flag-5'>語音</b><b class='flag-5'>識別</b><b class='flag-5'>技術</b>引領智能<b class='flag-5'>語音</b>燈具市場——NRK3502

    基于語音識別的智能會議系統具備哪些交互功能

    標貝科技專注智能語音交互領域多年,在語音識別語音合成領域有著多項大型企業(yè)合作案例,標貝與多個智能會議系統廠商合作,成功將語音
    的頭像 發(fā)表于 12-20 10:35 ?902次閱讀