chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

電子發(fā)燒友App

硬聲App

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內(nèi)不再提示
創(chuàng)作
電子發(fā)燒友網(wǎng)>電子資料下載>可編程邏輯>FPGA/ASIC>淺談手機語音識別應用中選擇DSP的策略

淺談手機語音識別應用中選擇DSP的策略

2017-11-06 | rar | 0.4 MB | 次下載 | 1積分

資料介紹

隨著DSP技術的進步,計算能力更強、功耗更低和體積更小的DSP已經(jīng)出現(xiàn),使3G手機上植入更精確更復雜的自動語音識別(ASR)功能成為可能。目前,基本ASR應用可以分成三大類:1. 語音-文本轉(zhuǎn)換(語音輸入);2. 講者識別;3. 語音命令控制(語音控制)。
  這三類功能包含了3G所需的眾多ASR性能。語音-文本轉(zhuǎn)換的典型實例是語音撥號和電子郵件聽寫。講者識別功能可以通過語音識別安全地讀出存儲器中的個人數(shù)據(jù),從而滿足信用卡定購和銀行服務等保密性高的應用需要。語音命令控制功能包括連接語音擴展標記語言(VXML)網(wǎng)站內(nèi)容的語音接口,它支持財經(jīng)服務與目錄助理等業(yè)務。目前VXML被用于規(guī)范網(wǎng)站內(nèi)容的語音標簽。
  語音識別的兩種方法
  3G手機的ASR應用設計可分為兩類,即以終端為中心和以客戶/服務器為中心的應用。如圖1所示為以終端為中心的設計方法,3G手機(終端)執(zhí)行整個語音識別過程并送出識別結果。在圖2所示的客戶/服務器方法中,終端只是執(zhí)行預處理特征提取,然后通過一個誤碼受保護的數(shù)據(jù)信道將這些參數(shù)發(fā)送給中心服務器,中心服務器最終完成語音識別。如果采用以客戶/服務器為中心的設計方法,3G手機應使用數(shù)據(jù)信道而非移動信道來將語音發(fā)送給服務器進行識別,因為移動信道所用的低速率語音編碼會嚴重影響語音識別的性能。
  各種ASR系統(tǒng)的差異主要體現(xiàn)在詞匯量上。一個簡單的網(wǎng)絡設備可能只需要16字的詞庫就能實現(xiàn)所要求的語音識別功能,而3G移動手機則需要更大的專業(yè)詞庫。這些詞匯可以跟講者相關(訓練語音識別設備使之熟悉用戶的聲音特征)或跟講者無關(語音識別設備可以識別任何人的聲音),DSP的計算負荷就隨著詞匯量和訓練數(shù)據(jù)的增加而增大。
  例如,根據(jù)隱性馬爾可夫模型(HMM)可以分析一個典型的跟講者無關的100條命令識別的應用實例。假設HMM模型從左到右沒有跳躍地順序擺放,共有6個狀態(tài)、5個具有對角協(xié)方差的混合高斯分布,包含39個特征(13嘜-頻率對數(shù)系數(shù)或MFCC,及其一階和二階差分),具有16位精度,那么,HMM聲學模型的大小就是100×5×5×(39+2)×2=240kB。
  為了實現(xiàn)輸入語音樣本差分、窗口截獲、MFCC抽取、概率計算和維特比搜索等運算的實時性,典型情況下需要消耗DSP的1千萬個乘法-累加周期(MMAC)。對于連續(xù)語音識別來說,上千個三音素模型和多種語法模型需要更多的存儲空間,也需要更快的DSP處理速度。
  因此,移動電話中ASR系統(tǒng)的成敗很大程度上取決于DSP的功能和設計。第三代系統(tǒng)本身就需要比第二代系統(tǒng)更強性能的DSP,而增加ASR功能就對DSP提出了更高的要求。從結構角度看,對DSP性能的要求是處理速度快、功耗低和代碼密度高。
  采用高速DSP是關鍵
  由于系統(tǒng)要實時對語音進行處理和取樣,因此語音識別系統(tǒng)需要具有巨大的計算能力。下面的數(shù)字和計算假設采用的是圍繞終端的設計方法。如果將DSP計算資源的20%分配給一個10MMAC的語音識別系統(tǒng)使用,那么就需要一個具有50MMAC的DSP才能滿足這一功能需要,并可提供足夠的空間執(zhí)行3G手機所需的其它DSP任務,如處理軟貓。如果采用較慢的DSP,如25MMAC的DSP,那么詞匯表中的命令數(shù)量就要減半,或減少HMM參數(shù),這樣會降低整個系統(tǒng)性能。
  DSP的速度決定了語音識別系統(tǒng)的復雜性和性能。舉例來說,如果一個基本的跟講者無關的連續(xù)語音識別系統(tǒng)需要100MMAC,DSP計算資源的50%用于滿足3G手機的其它DSP任務的需求,那么DSP的處理速度就需要達到200MMAC。
  成本、性能和效率的折衷
  DSP的速度越快,就越便于利用現(xiàn)代的HMM技術,如信道匹配和聲域匹配技術,因此,理論上講,DSP速度越快,ASR系統(tǒng)的性能就越好。然而,并行處理方法在提高ASR系統(tǒng)吞吐量中也扮演著重要角色。例如,一個具有4 ALU(算術邏輯單元)的200MHz DSP比只有1 ALU但運行于400MHz的DSP具有更高的吞吐量。根據(jù)具體應用的不同,2到3個單ALU DSP提供的性能與一個具有4 ALU的DSP相仿。相對一個具有4 ALU的DSP處理器方案來說,多個單ALU的DSP會提高手機的成本,因此對于適銷對路產(chǎn)品要充分權衡成本與性能之間的折衷。
  總之,當比較一個600MHz的單ALU DSP和一個300MHz但有4 ALU的DSP時,設計工程師始終應把握的最終目標是高效的運算吞吐量,具有多個ALU的DSP也許是最好的解決方案。
  性能與功耗
  頂級性能的DSP采用并行結構來獲得最佳的性能空間。有個著名的平衡型并行結構StarCore SC140就采用了指令級并行結構,它具有4個并行ALU以及一個稱為變長執(zhí)行集(VLES)的改進型甚長指令字模型。VLES的優(yōu)點在于它支持在內(nèi)存中完成高效的指令調(diào)度、執(zhí)行和打包。它能通過一個指令隊列對前端提供反饋,并通過調(diào)度器控制后端,因此除非需要執(zhí)行計算,VLES處理一般不消耗功率。
  在并行VLES結構中,一些特殊指令需要成組以避免空操作(Nop),由于減少了時鐘周期,處理時間也相應減少了。比較而言,在甚長指令字計算中,所有執(zhí)行步驟都必須按順序排列,因此在一個8字節(jié)的執(zhí)行集甚至是1字節(jié)數(shù)據(jù)時,系統(tǒng)就需要7個占位符(placeholder)或Nop。
  由于VLES結構不需要Nop,VLES設計中的復雜性從硬件或編程器轉(zhuǎn)移到了編譯器。由于每個周期都充滿了數(shù)據(jù),因此每個周期就具有更高的效率,從而也提高了電源與內(nèi)存的使用效率。
  電源管理
  由于ASR系統(tǒng)需要連續(xù)處理語音數(shù)據(jù),會使DSP成為消耗電能的主要部件,因此高效利用電源對設備成功走向市場至關重要。
  在高性能DSP中,選擇16位指令集而非32位指令集能提高代碼密度,進一步減少對內(nèi)存、功耗和體積的需求,一部分原因是由于更短的16位指令集可以減少寄存器和數(shù)據(jù)線數(shù)量。例如在ASR應用中,存儲的詞匯量可能達到2.5MB(對于1024簇的三音素狀態(tài),5個合成和39個參數(shù)來說,聲學HMM狀態(tài)模型是400KB;一本有1萬個三態(tài)三音素代碼本是60KB;三音素狀態(tài)轉(zhuǎn)移概率矩陣是500KB;一個具有40個雜亂態(tài)2萬字的雙字母組是1.6MB)。如果DSP具有高的代碼密度,能為ASR系統(tǒng)提供固定數(shù)量的存儲器,那么就可以獲得更好更大的聲學和語言模型。
下載該資料的人也在下載 下載該資料的人還在閱讀
更多 >

評論

查看更多

下載排行

本周

  1. 1QW2893應急燈專用檢測芯片
  2. 590.40 KB  |  1次下載  |  免費
  3. 2低功耗藍牙BLE透傳模塊HM-BT4531的技術規(guī)格與應用指南
  4. 1.40 MB  |  1次下載  |  免費
  5. 3PC2570低Iq 理想二極管控制芯片中文資料
  6. 1.56 MB   |  1次下載  |  免費
  7. 4AG32VH 系列應用指南
  8. 0.60 MB   |  1次下載  |  免費
  9. 5Claroty-2024年全球CPS安全狀況:中斷對業(yè)務的影響
  10. 3.70 MB   |  1次下載  |  免費
  11. 6stm32g070數(shù)據(jù)手冊和使用手冊
  12. 12.06 MB   |  次下載  |  免費
  13. 7FS312B USB的PD和OC快充協(xié)議電壓誘騙控制器中文手冊
  14. 1.35 MB   |  次下載  |  免費
  15. 8SY8201矽力杰高效率快速響應,1A, 27V輸入 同步降壓調(diào)節(jié)器
  16. 510.16 KB  |  次下載  |  免費

本月

  1. 1AI智能眼鏡產(chǎn)業(yè)鏈分析
  2. 4.43 MB   |  471次下載  |  免費
  3. 2蘇泊爾電磁爐線路的電路原理圖資料合集
  4. 2.02 MB   |  300次下載  |  5 積分
  5. 3貼片三極管上的印字與真實名稱的對照表詳細說明
  6. 0.50 MB   |  95次下載  |  1 積分
  7. 4長虹液晶電視R-HS310B-5HF01的電源板電路原理圖
  8. 0.46 MB   |  91次下載  |  5 積分
  9. 5涂鴉各WiFi模塊原理圖加PCB封裝
  10. 11.75 MB   |  89次下載  |  1 積分
  11. 6錦銳科技CA51F2 SDK開發(fā)包
  12. 24.06 MB   |  43次下載  |  1 積分
  13. 7AO4803A雙P通道增強型場效應晶體管的數(shù)據(jù)手冊
  14. 0.11 MB   |  28次下載  |  2 積分
  15. 8錦銳CA51F005 SDK開發(fā)包
  16. 19.47 MB   |  19次下載  |  1 積分

總榜

  1. 1matlab軟件下載入口
  2. 未知  |  935127次下載  |  10 積分
  3. 2開源硬件-PMP21529.1-4 開關降壓/升壓雙向直流/直流轉(zhuǎn)換器 PCB layout 設計
  4. 1.48MB  |  420064次下載  |  10 積分
  5. 3Altium DXP2002下載入口
  6. 未知  |  233089次下載  |  10 積分
  7. 4電路仿真軟件multisim 10.0免費下載
  8. 340992  |  191388次下載  |  10 積分
  9. 5十天學會AVR單片機與C語言視頻教程 下載
  10. 158M  |  183342次下載  |  10 積分
  11. 6labview8.5下載
  12. 未知  |  81588次下載  |  10 積分
  13. 7Keil工具MDK-Arm免費下載
  14. 0.02 MB  |  73815次下載  |  10 積分
  15. 8LabVIEW 8.6下載
  16. 未知  |  65989次下載  |  10 積分