chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

電子發(fā)燒友App

硬聲App

掃碼添加小助手

加入工程師交流群

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線(xiàn)課程
  • 觀(guān)看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示
創(chuàng)作
電子發(fā)燒友網(wǎng)>電子資料下載>可編程邏輯>FPGA/ASIC>淺談手機(jī)語(yǔ)音識(shí)別應(yīng)用中選擇DSP的策略

淺談手機(jī)語(yǔ)音識(shí)別應(yīng)用中選擇DSP的策略

2017-11-06 | rar | 0.4 MB | 次下載 | 1積分

資料介紹

隨著DSP技術(shù)的進(jìn)步,計(jì)算能力更強(qiáng)、功耗更低和體積更小的DSP已經(jīng)出現(xiàn),使3G手機(jī)上植入更精確更復(fù)雜的自動(dòng)語(yǔ)音識(shí)別(ASR)功能成為可能。目前,基本ASR應(yīng)用可以分成三大類(lèi):1. 語(yǔ)音-文本轉(zhuǎn)換(語(yǔ)音輸入);2. 講者識(shí)別;3. 語(yǔ)音命令控制(語(yǔ)音控制)。
  這三類(lèi)功能包含了3G所需的眾多ASR性能。語(yǔ)音-文本轉(zhuǎn)換的典型實(shí)例是語(yǔ)音撥號(hào)和電子郵件聽(tīng)寫(xiě)。講者識(shí)別功能可以通過(guò)語(yǔ)音識(shí)別安全地讀出存儲(chǔ)器中的個(gè)人數(shù)據(jù),從而滿(mǎn)足信用卡定購(gòu)和銀行服務(wù)等保密性高的應(yīng)用需要。語(yǔ)音命令控制功能包括連接語(yǔ)音擴(kuò)展標(biāo)記語(yǔ)言(VXML)網(wǎng)站內(nèi)容的語(yǔ)音接口,它支持財(cái)經(jīng)服務(wù)與目錄助理等業(yè)務(wù)。目前VXML被用于規(guī)范網(wǎng)站內(nèi)容的語(yǔ)音標(biāo)簽。
  語(yǔ)音識(shí)別的兩種方法
  3G手機(jī)的ASR應(yīng)用設(shè)計(jì)可分為兩類(lèi),即以終端為中心和以客戶(hù)/服務(wù)器為中心的應(yīng)用。如圖1所示為以終端為中心的設(shè)計(jì)方法,3G手機(jī)(終端)執(zhí)行整個(gè)語(yǔ)音識(shí)別過(guò)程并送出識(shí)別結(jié)果。在圖2所示的客戶(hù)/服務(wù)器方法中,終端只是執(zhí)行預(yù)處理特征提取,然后通過(guò)一個(gè)誤碼受保護(hù)的數(shù)據(jù)信道將這些參數(shù)發(fā)送給中心服務(wù)器,中心服務(wù)器最終完成語(yǔ)音識(shí)別。如果采用以客戶(hù)/服務(wù)器為中心的設(shè)計(jì)方法,3G手機(jī)應(yīng)使用數(shù)據(jù)信道而非移動(dòng)信道來(lái)將語(yǔ)音發(fā)送給服務(wù)器進(jìn)行識(shí)別,因?yàn)橐苿?dòng)信道所用的低速率語(yǔ)音編碼會(huì)嚴(yán)重影響語(yǔ)音識(shí)別的性能。
  各種ASR系統(tǒng)的差異主要體現(xiàn)在詞匯量上。一個(gè)簡(jiǎn)單的網(wǎng)絡(luò)設(shè)備可能只需要16字的詞庫(kù)就能實(shí)現(xiàn)所要求的語(yǔ)音識(shí)別功能,而3G移動(dòng)手機(jī)則需要更大的專(zhuān)業(yè)詞庫(kù)。這些詞匯可以跟講者相關(guān)(訓(xùn)練語(yǔ)音識(shí)別設(shè)備使之熟悉用戶(hù)的聲音特征)或跟講者無(wú)關(guān)(語(yǔ)音識(shí)別設(shè)備可以識(shí)別任何人的聲音),DSP的計(jì)算負(fù)荷就隨著詞匯量和訓(xùn)練數(shù)據(jù)的增加而增大。
  例如,根據(jù)隱性馬爾可夫模型(HMM)可以分析一個(gè)典型的跟講者無(wú)關(guān)的100條命令識(shí)別的應(yīng)用實(shí)例。假設(shè)HMM模型從左到右沒(méi)有跳躍地順序擺放,共有6個(gè)狀態(tài)、5個(gè)具有對(duì)角協(xié)方差的混合高斯分布,包含39個(gè)特征(13嘜-頻率對(duì)數(shù)系數(shù)或MFCC,及其一階和二階差分),具有16位精度,那么,HMM聲學(xué)模型的大小就是100×5×5×(39+2)×2=240kB。
  為了實(shí)現(xiàn)輸入語(yǔ)音樣本差分、窗口截獲、MFCC抽取、概率計(jì)算和維特比搜索等運(yùn)算的實(shí)時(shí)性,典型情況下需要消耗DSP的1千萬(wàn)個(gè)乘法-累加周期(MMAC)。對(duì)于連續(xù)語(yǔ)音識(shí)別來(lái)說(shuō),上千個(gè)三音素模型和多種語(yǔ)法模型需要更多的存儲(chǔ)空間,也需要更快的DSP處理速度。
  因此,移動(dòng)電話(huà)中ASR系統(tǒng)的成敗很大程度上取決于DSP的功能和設(shè)計(jì)。第三代系統(tǒng)本身就需要比第二代系統(tǒng)更強(qiáng)性能的DSP,而增加ASR功能就對(duì)DSP提出了更高的要求。從結(jié)構(gòu)角度看,對(duì)DSP性能的要求是處理速度快、功耗低和代碼密度高。
  采用高速DSP是關(guān)鍵
  由于系統(tǒng)要實(shí)時(shí)對(duì)語(yǔ)音進(jìn)行處理和取樣,因此語(yǔ)音識(shí)別系統(tǒng)需要具有巨大的計(jì)算能力。下面的數(shù)字和計(jì)算假設(shè)采用的是圍繞終端的設(shè)計(jì)方法。如果將DSP計(jì)算資源的20%分配給一個(gè)10MMAC的語(yǔ)音識(shí)別系統(tǒng)使用,那么就需要一個(gè)具有50MMAC的DSP才能滿(mǎn)足這一功能需要,并可提供足夠的空間執(zhí)行3G手機(jī)所需的其它DSP任務(wù),如處理軟貓。如果采用較慢的DSP,如25MMAC的DSP,那么詞匯表中的命令數(shù)量就要減半,或減少HMM參數(shù),這樣會(huì)降低整個(gè)系統(tǒng)性能。
  DSP的速度決定了語(yǔ)音識(shí)別系統(tǒng)的復(fù)雜性和性能。舉例來(lái)說(shuō),如果一個(gè)基本的跟講者無(wú)關(guān)的連續(xù)語(yǔ)音識(shí)別系統(tǒng)需要100MMAC,DSP計(jì)算資源的50%用于滿(mǎn)足3G手機(jī)的其它DSP任務(wù)的需求,那么DSP的處理速度就需要達(dá)到200MMAC。
  成本、性能和效率的折衷
  DSP的速度越快,就越便于利用現(xiàn)代的HMM技術(shù),如信道匹配和聲域匹配技術(shù),因此,理論上講,DSP速度越快,ASR系統(tǒng)的性能就越好。然而,并行處理方法在提高ASR系統(tǒng)吞吐量中也扮演著重要角色。例如,一個(gè)具有4 ALU(算術(shù)邏輯單元)的200MHz DSP比只有1 ALU但運(yùn)行于400MHz的DSP具有更高的吞吐量。根據(jù)具體應(yīng)用的不同,2到3個(gè)單ALU DSP提供的性能與一個(gè)具有4 ALU的DSP相仿。相對(duì)一個(gè)具有4 ALU的DSP處理器方案來(lái)說(shuō),多個(gè)單ALU的DSP會(huì)提高手機(jī)的成本,因此對(duì)于適銷(xiāo)對(duì)路產(chǎn)品要充分權(quán)衡成本與性能之間的折衷。
  總之,當(dāng)比較一個(gè)600MHz的單ALU DSP和一個(gè)300MHz但有4 ALU的DSP時(shí),設(shè)計(jì)工程師始終應(yīng)把握的最終目標(biāo)是高效的運(yùn)算吞吐量,具有多個(gè)ALU的DSP也許是最好的解決方案。
  性能與功耗
  頂級(jí)性能的DSP采用并行結(jié)構(gòu)來(lái)獲得最佳的性能空間。有個(gè)著名的平衡型并行結(jié)構(gòu)StarCore SC140就采用了指令級(jí)并行結(jié)構(gòu),它具有4個(gè)并行ALU以及一個(gè)稱(chēng)為變長(zhǎng)執(zhí)行集(VLES)的改進(jìn)型甚長(zhǎng)指令字模型。VLES的優(yōu)點(diǎn)在于它支持在內(nèi)存中完成高效的指令調(diào)度、執(zhí)行和打包。它能通過(guò)一個(gè)指令隊(duì)列對(duì)前端提供反饋,并通過(guò)調(diào)度器控制后端,因此除非需要執(zhí)行計(jì)算,VLES處理一般不消耗功率。
  在并行VLES結(jié)構(gòu)中,一些特殊指令需要成組以避免空操作(Nop),由于減少了時(shí)鐘周期,處理時(shí)間也相應(yīng)減少了。比較而言,在甚長(zhǎng)指令字計(jì)算中,所有執(zhí)行步驟都必須按順序排列,因此在一個(gè)8字節(jié)的執(zhí)行集甚至是1字節(jié)數(shù)據(jù)時(shí),系統(tǒng)就需要7個(gè)占位符(placeholder)或Nop。
  由于VLES結(jié)構(gòu)不需要Nop,VLES設(shè)計(jì)中的復(fù)雜性從硬件或編程器轉(zhuǎn)移到了編譯器。由于每個(gè)周期都充滿(mǎn)了數(shù)據(jù),因此每個(gè)周期就具有更高的效率,從而也提高了電源與內(nèi)存的使用效率。
  電源管理
  由于ASR系統(tǒng)需要連續(xù)處理語(yǔ)音數(shù)據(jù),會(huì)使DSP成為消耗電能的主要部件,因此高效利用電源對(duì)設(shè)備成功走向市場(chǎng)至關(guān)重要。
  在高性能DSP中,選擇16位指令集而非32位指令集能提高代碼密度,進(jìn)一步減少對(duì)內(nèi)存、功耗和體積的需求,一部分原因是由于更短的16位指令集可以減少寄存器和數(shù)據(jù)線(xiàn)數(shù)量。例如在ASR應(yīng)用中,存儲(chǔ)的詞匯量可能達(dá)到2.5MB(對(duì)于1024簇的三音素狀態(tài),5個(gè)合成和39個(gè)參數(shù)來(lái)說(shuō),聲學(xué)HMM狀態(tài)模型是400KB;一本有1萬(wàn)個(gè)三態(tài)三音素代碼本是60KB;三音素狀態(tài)轉(zhuǎn)移概率矩陣是500KB;一個(gè)具有40個(gè)雜亂態(tài)2萬(wàn)字的雙字母組是1.6MB)。如果DSP具有高的代碼密度,能為ASR系統(tǒng)提供固定數(shù)量的存儲(chǔ)器,那么就可以獲得更好更大的聲學(xué)和語(yǔ)言模型。
dsp FPGA
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

下載該資料的人也在下載 下載該資料的人還在閱讀
更多 >

評(píng)論

查看更多

下載排行

本周

  1. 1MDD品牌三極管MMBT3906數(shù)據(jù)手冊(cè)
  2. 2.33 MB  |  次下載  |  免費(fèi)
  3. 2MDD品牌三極管S9012數(shù)據(jù)手冊(cè)
  4. 2.62 MB  |  次下載  |  免費(fèi)
  5. 3聯(lián)想flex2-14D/15D說(shuō)明書(shū)
  6. 4.92 MB   |  次下載  |  免費(fèi)
  7. 4收音環(huán)繞擴(kuò)音機(jī) AVR-1507手冊(cè)
  8. 2.50 MB   |  次下載  |  免費(fèi)
  9. 524Pin Type-C連接器設(shè)計(jì)報(bào)告
  10. 1.06 MB   |  次下載  |  免費(fèi)
  11. 6新一代網(wǎng)絡(luò)可視化(NPB 2.0)
  12. 3.40 MB  |  次下載  |  免費(fèi)
  13. 7MS1000TA 超聲波測(cè)量模擬前端芯片技術(shù)手冊(cè)
  14. 0.60 MB   |  次下載  |  免費(fèi)
  15. 8MS1022高精度時(shí)間測(cè)量(TDC)電路數(shù)據(jù)手冊(cè)
  16. 1.81 MB   |  次下載  |  免費(fèi)

本月

  1. 1愛(ài)華AIWA HS-J202維修手冊(cè)
  2. 3.34 MB   |  37次下載  |  免費(fèi)
  3. 2PC5502負(fù)載均流控制電路數(shù)據(jù)手冊(cè)
  4. 1.63 MB   |  23次下載  |  免費(fèi)
  5. 3NB-IoT芯片廠(chǎng)商的資料說(shuō)明
  6. 0.31 MB   |  22次下載  |  1 積分
  7. 4H110主板CPU PWM芯片ISL95858HRZ-T核心供電電路圖資料
  8. 0.63 MB   |  6次下載  |  1 積分
  9. 5UWB653Pro USB口測(cè)距通信定位模塊規(guī)格書(shū)
  10. 838.47 KB  |  5次下載  |  免費(fèi)
  11. 6技嘉H110主板IT8628E_BX IO電路圖資料
  12. 2.61 MB   |  4次下載  |  1 積分
  13. 7蘇泊爾DCL6907(即CHK-S007)單芯片電磁爐原理圖資料
  14. 0.04 MB   |  4次下載  |  1 積分
  15. 8100W準(zhǔn)諧振反激式恒流電源電路圖資料
  16. 0.09 MB   |  2次下載  |  1 積分

總榜

  1. 1matlab軟件下載入口
  2. 未知  |  935137次下載  |  10 積分
  3. 2開(kāi)源硬件-PMP21529.1-4 開(kāi)關(guān)降壓/升壓雙向直流/直流轉(zhuǎn)換器 PCB layout 設(shè)計(jì)
  4. 1.48MB  |  420064次下載  |  10 積分
  5. 3Altium DXP2002下載入口
  6. 未知  |  233089次下載  |  10 積分
  7. 4電路仿真軟件multisim 10.0免費(fèi)下載
  8. 340992  |  191439次下載  |  10 積分
  9. 5十天學(xué)會(huì)AVR單片機(jī)與C語(yǔ)言視頻教程 下載
  10. 158M  |  183353次下載  |  10 積分
  11. 6labview8.5下載
  12. 未知  |  81602次下載  |  10 積分
  13. 7Keil工具M(jìn)DK-Arm免費(fèi)下載
  14. 0.02 MB  |  73822次下載  |  10 積分
  15. 8LabVIEW 8.6下載
  16. 未知  |  65991次下載  |  10 積分