chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

語(yǔ)音識(shí)別的技術(shù)歷程及工作原理

要長(zhǎng)高 ? 來(lái)源:網(wǎng)絡(luò)整理 ? 作者:網(wǎng)絡(luò)整理 ? 2024-03-22 16:58 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

語(yǔ)音識(shí)別技術(shù),也被稱為自動(dòng)語(yǔ)音識(shí)別(Automatic Speech Recognition,ASR),是以語(yǔ)音為研究對(duì)象,通過(guò)語(yǔ)音信號(hào)處理和模式識(shí)別讓機(jī)器理解人類語(yǔ)言,并將其轉(zhuǎn)換為計(jì)算機(jī)可輸入的數(shù)字信號(hào)的一門技術(shù)。

語(yǔ)音識(shí)別的技術(shù)歷程

現(xiàn)代語(yǔ)音識(shí)別可以追溯到1952年,Davis等人研制了世界上第一個(gè)能識(shí)別10個(gè)英文數(shù)字發(fā)音的實(shí)驗(yàn)系統(tǒng),從此正式開(kāi)啟了語(yǔ)音識(shí)別的進(jìn)程。語(yǔ)音識(shí)別發(fā)展到今天已經(jīng)有70多年,但從技術(shù)方向上可以大體分為三個(gè)階段。

下圖是從1993年到2017年在Switchboard上語(yǔ)音識(shí)別率的進(jìn)展情況,從圖中也可以看出1993年到2009年,語(yǔ)音識(shí)別一直處于GMM-HMM時(shí)代,語(yǔ)音識(shí)別率提升緩慢,尤其是2000年到2009年語(yǔ)音識(shí)別率基本處于停滯狀態(tài)。2009年隨著深度學(xué)習(xí)技術(shù),特別是DNN的興起,語(yǔ)音識(shí)別框架變?yōu)镈NN-HMM,語(yǔ)音識(shí)別進(jìn)入了DNN時(shí)代,語(yǔ)音識(shí)別精準(zhǔn)率得到了顯著提升。

2015年以后,由于“端到端”技術(shù)興起,語(yǔ)音識(shí)別進(jìn)入了百花齊放時(shí)代,語(yǔ)音界都在訓(xùn)練更深、更復(fù)雜的網(wǎng)絡(luò),同時(shí)利用端到端技術(shù)進(jìn)一步大幅提升了語(yǔ)音識(shí)別的性能,直到2017年微軟在Swichboard上達(dá)到詞錯(cuò)誤率5.1%,從而讓語(yǔ)音識(shí)別的準(zhǔn)確性首次超越了人類,當(dāng)然這是在一定限定條件下的實(shí)驗(yàn)結(jié)果,還不具有普遍代表性。

語(yǔ)音識(shí)別原理

語(yǔ)音識(shí)別的本質(zhì)是一種基于語(yǔ)音特征參數(shù)的模式識(shí)別,即通過(guò)學(xué)習(xí),系統(tǒng)能夠把輸入的語(yǔ)音按一定模式進(jìn)行分類,進(jìn)而依據(jù)判定準(zhǔn)則找出最佳匹配結(jié)果。目前,模式匹配原理已經(jīng)被應(yīng)用于大多數(shù)語(yǔ)音識(shí)別系統(tǒng)中。如圖1是基于模式匹配原理的語(yǔ)音識(shí)別系統(tǒng)框圖。

一般的模式識(shí)別包括預(yù)處理,特征提取,模式匹配等基本模塊。如圖所示首先對(duì)輸入語(yǔ)音進(jìn)行預(yù)處理,其中預(yù)處理包括分幀,加窗,預(yù)加重等。其次是特征提取,因此選擇合適的特征參數(shù)尤為重要。

常用的特征參數(shù)包括:基音周期,共振峰,短時(shí)平均能量或幅度,線性預(yù)測(cè)系數(shù)(LPC),感知加權(quán)預(yù)測(cè)系數(shù)(PLP),短時(shí)平均過(guò)零率,線性預(yù)測(cè)倒譜系數(shù)(LPCC),自相關(guān)函數(shù),梅爾倒譜系數(shù)(MFCC),小波變換系數(shù),經(jīng)驗(yàn)?zāi)B(tài)分解系數(shù)(EMD),伽馬通濾波器系數(shù)(GFCC)等。

在進(jìn)行實(shí)際識(shí)別時(shí),要對(duì)測(cè)試語(yǔ)音按訓(xùn)練過(guò)程產(chǎn)生模板,最后根據(jù)失真判決準(zhǔn)則進(jìn)行識(shí)別。常用的失真判決準(zhǔn)則有歐式距離,協(xié)方差矩陣與貝葉斯距離等。

語(yǔ)音識(shí)別技術(shù)涉及的領(lǐng)域有哪些

它涉及的領(lǐng)域相當(dāng)廣泛,包括但不限于以下幾個(gè)方面:

智能語(yǔ)音助手:智能語(yǔ)音技術(shù)為我們帶來(lái)了智能助理,如Siri、小愛(ài)同學(xué)等。用戶可以通過(guò)語(yǔ)音與智能助理進(jìn)行交流,詢問(wèn)天氣、定鬧鐘、發(fā)送消息等,實(shí)現(xiàn)更加直觀、便捷的操作。

智能家居:借助智能語(yǔ)音技術(shù),用戶可以通過(guò)簡(jiǎn)單的口頭指令控制家居設(shè)備,例如開(kāi)關(guān)燈、調(diào)整溫度、播放音樂(lè)等,實(shí)現(xiàn)智能家居的全方位控制和管理。

醫(yī)療領(lǐng)域:語(yǔ)音識(shí)別技術(shù)可以輔助醫(yī)生對(duì)病人進(jìn)行診斷,對(duì)病人的病情和治療方案進(jìn)行記錄等。此外,它還可以應(yīng)用于醫(yī)療設(shè)備的操作中,使得醫(yī)療設(shè)備更加智能化和便利化。

教育領(lǐng)域:語(yǔ)音識(shí)別技術(shù)可以輔助學(xué)生進(jìn)行口語(yǔ)練習(xí),提高學(xué)生的英語(yǔ)口語(yǔ)水平等。另外,它還可以應(yīng)用于教育評(píng)測(cè)中,通過(guò)語(yǔ)音識(shí)別來(lái)評(píng)估學(xué)生的語(yǔ)音表達(dá)能力、語(yǔ)感等。

金融領(lǐng)域:語(yǔ)音識(shí)別技術(shù)可以用于身份驗(yàn)證、語(yǔ)音指令操作等。此外,它還可以應(yīng)用于金融客戶服務(wù)中,使得客戶可以通過(guò)語(yǔ)音來(lái)查詢賬戶信息、進(jìn)行轉(zhuǎn)賬等操作,更加便捷快速。

游戲領(lǐng)域:語(yǔ)音識(shí)別技術(shù)可以應(yīng)用于游戲領(lǐng)域,如通過(guò)語(yǔ)音識(shí)別來(lái)與游戲角色進(jìn)行交互,使得游戲更加真實(shí)、有趣。

智能客服:語(yǔ)音識(shí)別技術(shù)可以幫助用戶通過(guò)語(yǔ)音指令獲取客服服務(wù),解決客服等待時(shí)間長(zhǎng)的問(wèn)題。

語(yǔ)音翻譯:在全球化的今天,語(yǔ)音識(shí)別技術(shù)可以幫助人們實(shí)現(xiàn)不同語(yǔ)言之間的翻譯。

隨著技術(shù)的不斷發(fā)展和完善,語(yǔ)音識(shí)別技術(shù)將在更多領(lǐng)域得到應(yīng)用,并為人們的生活帶來(lái)更多便利。

審核編輯:黃飛

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    特定人語(yǔ)音識(shí)別的方法有哪些?

    特定人語(yǔ)音識(shí)別的方法有哪些?特定人語(yǔ)音識(shí)別技術(shù)在汽車控制上的應(yīng)用是什么?
    發(fā)表于 05-14 06:34

    自動(dòng)語(yǔ)音識(shí)別的原理是什么?

    自動(dòng)語(yǔ)音識(shí)別的原理是什么?如何利用WaveNet實(shí)現(xiàn)自動(dòng)語(yǔ)音識(shí)別
    發(fā)表于 06-15 09:14

    離線語(yǔ)音識(shí)別和控制的工作原理及應(yīng)用

    的應(yīng)用越來(lái)越廣泛。本文將深入探討離線語(yǔ)音識(shí)別的工作原理,以及其所使用的技術(shù)。   一、離線語(yǔ)音識(shí)別的
    發(fā)表于 11-07 18:01

    離線語(yǔ)音識(shí)別及控制是怎樣的技術(shù)?

    信號(hào)轉(zhuǎn)化為文本或語(yǔ)義結(jié)果。  與傳統(tǒng)的云端語(yǔ)音識(shí)別相比,離線語(yǔ)音識(shí)別的工作原理是將語(yǔ)音
    發(fā)表于 11-24 17:41

    語(yǔ)音識(shí)別技術(shù)的發(fā)展歷程,語(yǔ)音識(shí)別是如何工作的?語(yǔ)音識(shí)別資料概述

    說(shuō)到語(yǔ)音識(shí)別,大家熟悉的可能是最近十年里才出現(xiàn)的微信語(yǔ)音轉(zhuǎn)文字,或者語(yǔ)音實(shí)時(shí)記錄和翻譯。但其實(shí)語(yǔ)音識(shí)別的
    的頭像 發(fā)表于 09-01 10:48 ?1.1w次閱讀

    語(yǔ)音識(shí)別的技術(shù)歷程

    深度學(xué)習(xí)技術(shù)自 2009 年興起之后,已經(jīng)取得了長(zhǎng)足進(jìn)步。語(yǔ)音識(shí)別的精度和速度取決于實(shí)際應(yīng)用環(huán)境,但在安靜環(huán)境、標(biāo)準(zhǔn)口音、常見(jiàn)詞匯場(chǎng)景下的語(yǔ)音識(shí)別
    的頭像 發(fā)表于 08-22 14:21 ?5048次閱讀

    簡(jiǎn)析語(yǔ)音識(shí)別技術(shù)工作原理

    語(yǔ)音識(shí)別技術(shù)是讓機(jī)器通過(guò)識(shí)別語(yǔ)音信號(hào)轉(zhuǎn)變?yōu)槲谋?,進(jìn)而通過(guò)理解轉(zhuǎn)變?yōu)橹噶畹?b class='flag-5'>技術(shù)。
    發(fā)表于 12-23 11:20 ?1.3w次閱讀
    簡(jiǎn)析<b class='flag-5'>語(yǔ)音</b><b class='flag-5'>識(shí)別</b><b class='flag-5'>技術(shù)</b>的<b class='flag-5'>工作原理</b>

    語(yǔ)音識(shí)別的兩個(gè)方法_語(yǔ)音識(shí)別的應(yīng)用有哪些

    本文主要闡述了語(yǔ)音識(shí)別的兩個(gè)方法及語(yǔ)音識(shí)別的應(yīng)用。
    發(fā)表于 04-01 09:04 ?6551次閱讀

    虹膜識(shí)別技術(shù)的過(guò)程_虹膜識(shí)別的發(fā)展歷程

    本文首先介紹了虹膜識(shí)別技術(shù)的概念,其次闡述了虹膜識(shí)別技術(shù)的過(guò)程,最后闡述了虹膜識(shí)別的發(fā)展歷程
    發(fā)表于 04-02 14:22 ?6279次閱讀

    淺析語(yǔ)音識(shí)別技術(shù)的發(fā)展歷程

    語(yǔ)音轉(zhuǎn)文本識(shí)別,主要是識(shí)別和確認(rèn)發(fā)出語(yǔ)音的人而非其中所包含的內(nèi)容。 ? ? ? ?語(yǔ)音識(shí)別的目的
    的頭像 發(fā)表于 02-07 10:43 ?5792次閱讀

    語(yǔ)音識(shí)別技術(shù)的進(jìn)步與挑戰(zhàn)

    一、引言 在當(dāng)今數(shù)字化時(shí)代,語(yǔ)音識(shí)別技術(shù)已經(jīng)成為人機(jī)交互的重要方式之一。本文將探討語(yǔ)音識(shí)別技術(shù)
    的頭像 發(fā)表于 09-22 18:29 ?1524次閱讀

    離線語(yǔ)音識(shí)別和控制的工作原理及應(yīng)用

    。本文將深入探討離線語(yǔ)音識(shí)別的工作原理,以及其所使用的技術(shù)。一、離線語(yǔ)音識(shí)別的
    的頭像 發(fā)表于 11-07 18:04 ?1826次閱讀
    離線<b class='flag-5'>語(yǔ)音</b><b class='flag-5'>識(shí)別</b>和控制的<b class='flag-5'>工作原理</b>及應(yīng)用

    情感語(yǔ)音識(shí)別的前世今生

    的支持。本文將探討情感語(yǔ)音識(shí)別的前世今生,包括其發(fā)展歷程、應(yīng)用場(chǎng)景、面臨的挑戰(zhàn)以及未來(lái)發(fā)展趨勢(shì)。 二、情感語(yǔ)音識(shí)別的發(fā)展
    的頭像 發(fā)表于 11-12 17:33 ?1159次閱讀

    情感語(yǔ)音識(shí)別的研究方法與實(shí)踐

    一、引言 情感語(yǔ)音識(shí)別是指通過(guò)計(jì)算機(jī)技術(shù)和人工智能算法自動(dòng)識(shí)別和理解人類語(yǔ)音中的情感信息。為了提高情感語(yǔ)
    的頭像 發(fā)表于 11-16 16:26 ?1513次閱讀

    情感語(yǔ)音識(shí)別的應(yīng)用與挑戰(zhàn)

    一、引言 情感語(yǔ)音識(shí)別是一種通過(guò)分析人類語(yǔ)音中的情感信息實(shí)現(xiàn)智能化和個(gè)性化人機(jī)交互的技術(shù)。本文將探討情感語(yǔ)音
    的頭像 發(fā)表于 11-30 10:40 ?1352次閱讀