chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

語(yǔ)音識(shí)別芯片的語(yǔ)音識(shí)別系統(tǒng)是如何構(gòu)成的?

jf_07350686 ? 來(lái)源:jf_07350686 ? 作者:jf_07350686 ? 2022-12-29 17:18 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

語(yǔ)言識(shí)別模塊對(duì)中、大詞匯量的語(yǔ)音識(shí)別系統(tǒng)特別重要。當(dāng)分類發(fā)生錯(cuò)誤時(shí)可以根據(jù)語(yǔ)言學(xué)模型、語(yǔ)法結(jié)構(gòu)、語(yǔ)義學(xué)進(jìn)行判斷糾正,特別是一些同音字則必須通過上下文結(jié)構(gòu)才能確定詞義。語(yǔ)言學(xué)理論包括語(yǔ)義結(jié)構(gòu)、語(yǔ)法規(guī)則、語(yǔ)言的數(shù)學(xué)描述模型等有關(guān)方面。目前比較成功的語(yǔ)言模型通常是采用統(tǒng)計(jì)語(yǔ)法的語(yǔ)言模型與基于規(guī)則語(yǔ)法結(jié)構(gòu)命令語(yǔ)言模型。語(yǔ)法結(jié)構(gòu)可以限定不同詞之間的相互連接關(guān)系,減少了識(shí)別系統(tǒng)的搜索空間,這有利于提高系統(tǒng)的識(shí)別。

一個(gè)完整的基于統(tǒng)計(jì)的語(yǔ)音識(shí)別系統(tǒng)可大致分為三部分:

(1)語(yǔ)音信號(hào)預(yù)處理與特征提取;

(2)聲學(xué)模型與模式匹配;

(3)語(yǔ)言模型與語(yǔ)言處理 選擇識(shí)別單元是語(yǔ)音識(shí)別研究的第一步。語(yǔ)音識(shí)別單元有單詞(句)、音節(jié)和音素三種,具體選擇哪一種,由具體的研究任務(wù)決定。

單詞(句)單元廣泛應(yīng)用于中小詞匯語(yǔ)音識(shí)別系統(tǒng),但不適合大詞匯系統(tǒng),原因在于模型庫(kù)太龐大,訓(xùn)練模型任務(wù)繁重,模型匹配算法復(fù)雜,難以滿足實(shí)時(shí)性要求。

音節(jié)單元多見于漢語(yǔ)語(yǔ)音識(shí)別,主要因?yàn)闈h語(yǔ)是單音節(jié)結(jié)構(gòu)的語(yǔ)言,而英語(yǔ)是多音節(jié),并且漢語(yǔ)雖然有大約1300個(gè)音節(jié),但若不考慮聲調(diào),約有408個(gè)無(wú)調(diào)音節(jié),數(shù)量相對(duì)較少。因此,對(duì)于中、大詞匯量漢語(yǔ)語(yǔ)音識(shí)別系統(tǒng)來(lái)說(shuō),以音節(jié)為識(shí)別單元基本是可行的。

音素單元以前多見于英語(yǔ)語(yǔ)音識(shí)別的研究中,但目前中、大詞匯量漢語(yǔ)語(yǔ)音識(shí)別系統(tǒng)也在越來(lái)越多地采用。原因在于漢語(yǔ)音節(jié)僅由聲母(包括零聲母有22個(gè))和韻母(共有28個(gè))構(gòu)成,且聲韻母聲學(xué)特性相差很大。實(shí)際應(yīng)用中常把聲母依后續(xù)韻母的不同而構(gòu)成細(xì)化聲母,這樣雖然增加了模型數(shù)目,但提高了易混淆音節(jié)的區(qū)分能力。由于協(xié)同發(fā)音的影響,音素單元不穩(wěn)定,所以如何獲得穩(wěn)定的音素單元,還有待研究。

語(yǔ)音識(shí)別一個(gè)根本的問題是合理的選用特征。特征參數(shù)提取的目的是對(duì)語(yǔ)音信號(hào)進(jìn)行分析處理,去掉與語(yǔ)音識(shí)別無(wú)關(guān)的冗余信息,獲得影響語(yǔ)音識(shí)別的重要信息,同時(shí)對(duì)語(yǔ)音信號(hào)進(jìn)行壓縮。在實(shí)際應(yīng)用中,語(yǔ)音信號(hào)的壓縮率介于10-100之間。語(yǔ)音信號(hào)包含了大量各種不同的信息,提取哪些信息,用哪種方式提取,需要綜合考慮各方面的因素,如成本,性能,響應(yīng)時(shí)間,計(jì)算量等。非特定人語(yǔ)音識(shí)別系統(tǒng)一般側(cè)重提取反映語(yǔ)義的特征參數(shù),盡量去除說(shuō)話人的個(gè)人信息;而特定人語(yǔ)音識(shí)別系統(tǒng)則希望在提取反映語(yǔ)義的特征參數(shù)的同時(shí),盡量也包含說(shuō)話人的個(gè)人信息。

線性預(yù)測(cè)(LP)分析技術(shù)是目前應(yīng)用廣泛的特征參數(shù)提取技術(shù),許多成功的應(yīng)用系統(tǒng)都采用基于LP技術(shù)提取的倒譜參數(shù)。但線性預(yù)測(cè)模型是純數(shù)學(xué)模型,沒有考慮人類聽覺系統(tǒng)對(duì)語(yǔ)音的處理特點(diǎn)。

也有研究者嘗試把小波分析技術(shù)應(yīng)用于特征提取,但目前性能難以與上述技術(shù)相比,有待進(jìn)一步研究。 聲學(xué)模型通常是將獲取的語(yǔ)音特征使用訓(xùn)練算法進(jìn)行訓(xùn)練后產(chǎn)生。在識(shí)別時(shí)將輸入的語(yǔ)音特征同聲學(xué)模型(模式)進(jìn)行匹配與比較,得到最佳的識(shí)別結(jié)果。

聲學(xué)模型是識(shí)別系統(tǒng)的底層模型,并且是語(yǔ)音識(shí)別系統(tǒng)中最關(guān)鍵的一部分。聲學(xué)模型的目的是提供一種有效的方法計(jì)算語(yǔ)音的特征矢量序列和每個(gè)發(fā)音模板之間的距離。聲學(xué)模型的設(shè)計(jì)和語(yǔ)言發(fā)音特點(diǎn)密切相關(guān)。聲學(xué)模型單元大小(字發(fā)音模型、半音節(jié)模型或音素模型)對(duì)語(yǔ)音訓(xùn)練數(shù)據(jù)量大小、系統(tǒng)識(shí)別率,以及靈活性有較大的影響。必須根據(jù)不同語(yǔ)言的特點(diǎn)、識(shí)別系統(tǒng)詞匯量的大小決定識(shí)別單元的大小。

以漢語(yǔ)為例:

漢語(yǔ)按音素的發(fā)音特征分類分為輔音、單元音、復(fù)元音、復(fù)鼻尾音四種,按音節(jié)結(jié)構(gòu)分類為聲母和韻母。并且由音素構(gòu)成聲母或韻母。有時(shí),將含有聲調(diào)的韻母稱為調(diào)母。由單個(gè)調(diào)母或由聲母與調(diào)母拼音成為音節(jié)。漢語(yǔ)的一個(gè)音節(jié)就是漢語(yǔ)一個(gè)字的音,即音節(jié)字。由音節(jié)字構(gòu)成詞,最后再由詞構(gòu)成句子。

漢語(yǔ)聲母共有22個(gè),其中包括零聲母,韻母共有38個(gè)。按音素分類,漢語(yǔ)輔音共有22個(gè),單元音13個(gè),復(fù)元音13個(gè),復(fù)鼻尾音16個(gè)。

目前常用的聲學(xué)模型基元為聲韻母、音節(jié)或詞,根據(jù)實(shí)現(xiàn)目的不同來(lái)選取不同的基元。漢語(yǔ)加上語(yǔ)氣詞共有412個(gè)音節(jié),包括輕音字,共有1282個(gè)有調(diào)音節(jié)字,所以當(dāng)在小詞匯表孤立詞語(yǔ)音識(shí)別時(shí)常選用詞作為基元,在大詞匯表語(yǔ)音識(shí)別時(shí)常采用音節(jié)或聲韻母建模,而在連續(xù)語(yǔ)音識(shí)別時(shí),由于協(xié)同發(fā)音的影響,常采用聲韻母建模。

基于統(tǒng)計(jì)的語(yǔ)音識(shí)別模塊常用的就是HMM模型λ(N,M,π,A,B),涉及到HMM模型的相關(guān)理論包括模型的結(jié)構(gòu)選取、模型的初始化、模型參數(shù)的重估以及相應(yīng)的識(shí)別算法等。 語(yǔ)言模塊包括由識(shí)別語(yǔ)音命令構(gòu)成的語(yǔ)法網(wǎng)絡(luò)或由統(tǒng)計(jì)方法構(gòu)成的語(yǔ)言模型,語(yǔ)言處理可以進(jìn)行語(yǔ)法、語(yǔ)義分析。

審核編輯:湯梓紅

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    語(yǔ)音識(shí)別芯片有哪些(語(yǔ)音識(shí)別芯片AT680系列)

    在人工智能技術(shù)飛速發(fā)展的今天,語(yǔ)音識(shí)別芯片作為人機(jī)交互的重要橋梁,正逐漸成為各類智能設(shè)備不可或缺的核心部件。與傳統(tǒng)的語(yǔ)音芯片不同,
    的頭像 發(fā)表于 11-14 17:11 ?1026次閱讀

    什么是離線語(yǔ)音識(shí)別芯片(離線語(yǔ)音識(shí)別芯片有哪些優(yōu)點(diǎn))

    離線語(yǔ)音識(shí)別芯片,是一種集成了語(yǔ)音信號(hào)采集、前端處理和本地識(shí)別功能的專用集成電路,無(wú)須聯(lián)網(wǎng)也可以進(jìn)行語(yǔ)音
    的頭像 發(fā)表于 10-31 15:27 ?268次閱讀

    如何選擇合適的語(yǔ)音識(shí)別芯片型號(hào)

    語(yǔ)音識(shí)別芯片(又稱語(yǔ)音識(shí)別IC)是現(xiàn)代智能設(shè)備的核心組件,與傳統(tǒng)語(yǔ)音
    的頭像 發(fā)表于 10-30 16:32 ?462次閱讀

    語(yǔ)音識(shí)別系統(tǒng)的技術(shù)核心:從聲音到文字的智能轉(zhuǎn)換

    ? ? ? 語(yǔ)音識(shí)別技術(shù),也稱為自動(dòng)語(yǔ)音識(shí)別(ASR),其核心目標(biāo)是將人類語(yǔ)音信號(hào)轉(zhuǎn)換為對(duì)應(yīng)的文本或指令。隨著人工智能的發(fā)展,
    的頭像 發(fā)表于 09-05 14:04 ?557次閱讀

    語(yǔ)音識(shí)別---大家怎么看呢?

    語(yǔ)音識(shí)別是一門交叉學(xué)科。近二十年來(lái),語(yǔ)音識(shí)別技術(shù)取得顯著進(jìn)步,開始從實(shí)驗(yàn)室走向市場(chǎng)。人們預(yù)計(jì),未來(lái)10年內(nèi),語(yǔ)音
    發(fā)表于 08-09 10:54

    EASY EAl Orin Nano(RK3576) whisper語(yǔ)音識(shí)別訓(xùn)練部署教程

    1Whisper簡(jiǎn)介Whisper是OpenAI開源的,識(shí)別語(yǔ)音識(shí)別能力已達(dá)到人類水準(zhǔn)自動(dòng)語(yǔ)音識(shí)別系統(tǒng)。Whisper作為一個(gè)通用的
    的頭像 發(fā)表于 07-25 15:21 ?551次閱讀
    EASY EAl Orin Nano(RK3576) whisper<b class='flag-5'>語(yǔ)音</b><b class='flag-5'>識(shí)別</b>訓(xùn)練部署教程

    EASY EAl Orin Nano(RK3576) whisper語(yǔ)音識(shí)別訓(xùn)練部署教程

    Whisper是OpenAI開源的,識(shí)別語(yǔ)音識(shí)別能力已達(dá)到人類水準(zhǔn)自動(dòng)語(yǔ)音識(shí)別系統(tǒng)。Whisper作為一個(gè)通用的
    的頭像 發(fā)表于 07-17 14:55 ?1439次閱讀
    EASY EAl Orin Nano(RK3576) whisper<b class='flag-5'>語(yǔ)音</b><b class='flag-5'>識(shí)別</b>訓(xùn)練部署教程

    語(yǔ)音識(shí)別芯片選型有哪些技術(shù)參數(shù)要注意

    性能參數(shù) 1. 識(shí)別準(zhǔn)確率 定義:芯片對(duì)語(yǔ)音指令的正確識(shí)別比例,通常以百分比表示(如 95% 以上)。 影響因素:環(huán)境噪聲、發(fā)音清晰度、方言適配性等。 應(yīng)用場(chǎng)景:智能家居、車載
    的頭像 發(fā)表于 06-23 17:31 ?674次閱讀
    <b class='flag-5'>語(yǔ)音</b><b class='flag-5'>識(shí)別</b><b class='flag-5'>芯片</b>選型有哪些技術(shù)參數(shù)要注意

    普強(qiáng)信息入選2024語(yǔ)音識(shí)別技術(shù)公司TOP30榜單

    企業(yè)數(shù)字化升級(jí),這一榮譽(yù)不僅體現(xiàn)了普強(qiáng)在語(yǔ)音交互、語(yǔ)義理解、多語(yǔ)種識(shí)別等核心技術(shù)上的領(lǐng)先優(yōu)勢(shì),更是對(duì)普強(qiáng)自主研發(fā)的端到端語(yǔ)音識(shí)別系統(tǒng)在高噪聲環(huán)境、復(fù)雜口音等極端場(chǎng)景下仍能保持95%以上
    的頭像 發(fā)表于 04-18 17:25 ?1006次閱讀

    廠家芯資訊|廣州唯創(chuàng)電子語(yǔ)音識(shí)別芯片技術(shù)解析

    ?一、公司及產(chǎn)品概述作為國(guó)內(nèi)領(lǐng)先的語(yǔ)音芯片研發(fā)企業(yè),深耕語(yǔ)音技術(shù)領(lǐng)域25年,其產(chǎn)品以高穩(wěn)定性、低功耗和多場(chǎng)景適應(yīng)性著稱。公司推出的語(yǔ)音識(shí)別
    的頭像 發(fā)表于 03-19 08:46 ?649次閱讀
    廠家芯資訊|廣州唯創(chuàng)電子<b class='flag-5'>語(yǔ)音</b><b class='flag-5'>識(shí)別</b><b class='flag-5'>芯片</b>技術(shù)解析

    空調(diào)語(yǔ)音控制方案NRK3501語(yǔ)音識(shí)別芯片-讓智能生活觸手可及!

    NRK3501語(yǔ)音識(shí)別芯片支持離線語(yǔ)音控制空調(diào),精準(zhǔn)識(shí)別,遠(yuǎn)場(chǎng)降噪,最多支持200條離線指令,5米內(nèi)識(shí)別
    的頭像 發(fā)表于 01-07 11:40 ?1258次閱讀
    空調(diào)<b class='flag-5'>語(yǔ)音</b>控制方案NRK3501<b class='flag-5'>語(yǔ)音</b><b class='flag-5'>識(shí)別</b><b class='flag-5'>芯片</b>-讓智能生活觸手可及!

    【「嵌入式系統(tǒng)設(shè)計(jì)與實(shí)現(xiàn)」閱讀體驗(yàn)】+ 基于語(yǔ)音識(shí)別的智能杯墊

    合理,改善飲水規(guī)律。 主要?jiǎng)?chuàng)新點(diǎn): 磁力攪拌,通過電機(jī)轉(zhuǎn)動(dòng)實(shí)現(xiàn)磁力攪拌功能。 IPS顯示屏,顯示飲水?dāng)?shù)據(jù)。 數(shù)據(jù)存儲(chǔ),保存用戶可供分許的飲水?dāng)?shù)據(jù)。 語(yǔ)音識(shí)別功能,該模塊采用的是ASR_PRO芯片
    發(fā)表于 01-02 18:15

    標(biāo)貝數(shù)據(jù)標(biāo)注案例分享:車載語(yǔ)音系統(tǒng)數(shù)據(jù)標(biāo)注

    車載語(yǔ)音識(shí)別系統(tǒng)是指利用機(jī)器學(xué)習(xí)算法實(shí)現(xiàn)的一種自然語(yǔ)言處理技術(shù),載語(yǔ)音識(shí)別系統(tǒng)通過辨別聲音的語(yǔ)調(diào)、語(yǔ)速和音量,將所聽到的語(yǔ)音轉(zhuǎn)化成可讀取的語(yǔ)
    的頭像 發(fā)表于 12-24 14:24 ?827次閱讀
    標(biāo)貝數(shù)據(jù)標(biāo)注案例分享:車載<b class='flag-5'>語(yǔ)音</b><b class='flag-5'>系統(tǒng)</b>數(shù)據(jù)標(biāo)注

    基于語(yǔ)音識(shí)別的智能會(huì)議系統(tǒng)具備哪些交互功能

    標(biāo)貝科技專注智能語(yǔ)音交互領(lǐng)域多年,在語(yǔ)音識(shí)別語(yǔ)音合成領(lǐng)域有著多項(xiàng)大型企業(yè)合作案例,標(biāo)貝與多個(gè)智能會(huì)議系統(tǒng)廠商合作,成功將
    的頭像 發(fā)表于 12-20 10:35 ?896次閱讀