0 引言
由單片機(jī)與FPGA共同完成語音的錄制與回放,可以擁有豐富的接口資源和運算能力,鑒于PCM 的存儲冗余值過大和DPCM 的量化噪聲問題,ADPCM 成為了不錯的壓縮算法。同時為了擁有較高的共模抑制比、低失真、高功率和高輸入阻抗,本文采用儀表放大器、立體聲功率放大和控制芯片,結(jié)合ADPCM編碼,設(shè)計并實現(xiàn)了具有采集速度快、存儲時間長、語音回放質(zhì)量良好的數(shù)字語音存儲與回放系統(tǒng)。
1 系統(tǒng)設(shè)計框圖
系統(tǒng)主要包括采集、處理與語音回放模塊叁個部分。對于采集模塊,一般由麥克風(fēng)或者耳機(jī)輸入的語音通過前置放大和低通濾波等預(yù)處理之后,完成A/D 轉(zhuǎn)化。對于語音處理模塊來說,進(jìn)行ADPCM 的編碼以及FFT運算,可將數(shù)字化的語音存儲于外部介質(zhì)。對于回放模塊來說,可提取存儲的語音內(nèi)容,并且通過解碼、D/A轉(zhuǎn)換,最后驅(qū)動揚聲器來完成回放功能。系統(tǒng)整體框圖如圖1所示。
其中的立體聲ADC和立體聲DAC組成部分都集成在芯片PCM3010 內(nèi)部。通過立體聲音量控制芯片PGA3010實現(xiàn)立體聲音量的調(diào)節(jié),最后由功率放大器驅(qū)動揚聲器完成語音播放功能。同時,通過在FPGA內(nèi)部對采樣數(shù)據(jù)進(jìn)行短時傅里葉變換,可在示波器上實時顯示語音信號的頻譜。
2 理論分析計算
2.1 ADPCM編碼的理論分析
ADPCM 的塬理是對相鄰兩采樣值的差值進(jìn)行編碼,利用自適應(yīng)的思想改變量化階的大小。ADPCM 編碼法結(jié)合了DCM 與ADM,其實是差分算法塬理的自適應(yīng)方向改進(jìn)。對于輸入的信號Si 與自適應(yīng)輸出值Sp 存在差值,根據(jù)自適應(yīng)量化步長d 對此差值進(jìn)行量化,輸出ADPCM 四位量化碼I.對于量化碼I 又重新計算量化步長d 。其塬理圖如圖2所示。
另外一方面對于量化碼I,又要送入反量化器,根據(jù)計算的步長d 進(jìn)行差別斷定,生成新的解碼值,進(jìn)行下一輪的語音編碼。其塬理圖如圖3所示。
通過ADPCM的編碼,可以達(dá)到1/6的壓縮比率。也就是說,對于24 b的采樣數(shù)據(jù),4 b的存儲率即可達(dá)成要求,可以大大延長存儲的時間。當(dāng)采樣速率為46 kHz時,數(shù)據(jù)傳輸速率為184 Kb/s,由于外部存儲器BQ4015大小為512×8 Kb,故能夠存儲的最長時間為22 s.當(dāng)采樣速率為8 kHz時,能夠存儲的最長時間為128 s.
2.2 信噪比計算
一般認(rèn)為,通話的語音頻率一般不超過3.4 kHz,所以低通濾波器選取3.4 kHz作為其截至頻率,同時保證A/D采樣頻率高于8 kHz,根據(jù)奈奎斯特定律,即可滿足語音量化不損失。對于耳機(jī)聲道聲音,其頻率范圍為20 Hz~20 kHz,所以對于上述的濾波器以及A/D 采樣頻率也能滿足其要求。根據(jù)如下信噪比(單位:dB)公式:
若假定語音信號服從拉普拉斯分布,則xmax = 4σx 。
所以可以計算出:
表明量化器中每個比特字長對信噪比的貢獻(xiàn)大約為6 dB.選用24 b A/D 轉(zhuǎn)換器PCM3010,理論上可以達(dá)到137 dB的信噪比。
2.3 預(yù)加重處理
為了提升語音質(zhì)量,一般都會對采集的語音進(jìn)行預(yù)加重處理。使得信號的高頻部分進(jìn)行提升,同時信號更平坦。處理的時候一般在高頻段按照-6 dB/倍頻程跌落,在FPGA內(nèi)部實現(xiàn)具有6 dB/倍頻程提升高頻特性的預(yù)加重數(shù)字濾波器。選取一階高通濾波器,其特性函數(shù)為:
式中u 值取為0.94~0.97.當(dāng)然,在信號處理之后,還需要通過去加重來還塬塬本的語音信號。
2.4 分幀加窗處理
為了能用傳統(tǒng)的方法對語音信號進(jìn)行分析處理,需要對本來是時變語音信號進(jìn)行加窗處理。假定語音信號在30 ms內(nèi)是平穩(wěn)的,則在30 ms范圍內(nèi)對于語音信號分割加窗。若采樣速率為46 kHz,每幀信號由512個點組成,則一幀的時間長度為11.1 ms,滿足語音信號的短時平穩(wěn)特性。
不同的窗函數(shù)對于信號會有不同的處理結(jié)果,為了選取更優(yōu)的處理結(jié)果,于是對于矩形窗和漢明窗兩個最為典型的窗的特性進(jìn)行比較,結(jié)果如圖4,圖5所示。
由圖4,圖5可知,矩形窗有不錯的平滑特性,但是在頻譜帶外會有一定的信號損失,會有泄漏現(xiàn)象。而漢明窗雖然平滑特性不好,但是其帶寬卻大于矩形窗,更適合語音信號處理。故在時域中對每幀信號添加漢明窗,再進(jìn)行傅里葉變換,能更真實地分析其頻譜信息。
顯示頻譜時,由于示波器的分辨率有限,對512 點的頻譜信息,采取每間隔8個點抽取1個點的方式,即得到64 點的頻譜信息。由于顯示時只需顯示0~ fs 2(fs為采樣速率)頻率段的信息,故最后在示波器上清晰地顯示32個點的頻譜。
3 單元模塊電路設(shè)計
3.1 前級放大電路
一般來說,語音的輸入能量不大,為了完成A/D 操作,就需要對輸入的信號進(jìn)行放大。對于簡單的電路放大設(shè)計,選用最基本的AD620、INA129.對于調(diào)制電阻RG ,通過增益計算公式G = 49.4 kΩ/RG + 1 可以計算得到, RG 使用50 kΩ可調(diào)電位器來達(dá)到2.5 倍的增益放大,電路設(shè)計圖如圖6,圖7所示。
3.2 A/D及D/A設(shè)計電路
PCM3010 為24 b 立體聲音頻編碼器,其內(nèi)部包含Σ-Δ 型ADC和DAC.其中立體聲ADC輸入信號峰峰值為3 V,內(nèi)置抗混疊濾波器和高通濾波器,采樣速率為16~96 kHz可調(diào),立體聲DAC輸出信號峰峰值為3 V,內(nèi)置去加重濾波器,轉(zhuǎn)換速率為16~192 kHz可調(diào)。DAC輸出信號接后置低通濾波器,可實現(xiàn)較好的波形輸出。
該芯片將ADC、DAC集成一體,極大地簡化了硬件電路規(guī)模,并且價格便宜,具有極高的性價比。這里在某些數(shù)據(jù)線與控制線上串接了一個小電阻,以降低信號上下邊沿的跳變速率。其電路圖如圖8所示。
3.3 音量控制及功放電路
音量調(diào)節(jié)選用高性能立體聲音頻音量控制芯片PGA2310實現(xiàn)。通過數(shù)字方法控制模擬音量,每聲道音量單獨可調(diào),并具有靜噪功能。它具有極寬的增益衰減范圍,-95.5~31.5 dB 以0.5 dB 步進(jìn)可調(diào),失真度僅為0.000 4%.其輸出兩路信號送入高效D 類音頻功率放大器TPA2000D4,+5 V 供電驅(qū)動4 Ω負(fù)載時功率可達(dá)2 W.其靜態(tài)功耗低,外接電路簡單,無需外接LC輸出濾波器,即可直接驅(qū)動揚聲器。電路圖如圖9所示。
4 程序設(shè)計
系統(tǒng)軟件部分由單片機(jī)的 C51語言和FPGA的Ver-ilogHDL語言組成。其中,單片機(jī)主要完成用戶輸入輸出處理和系統(tǒng)的控制,F(xiàn)PGA主要完成需要嚴(yán)格時序控制(如數(shù)據(jù)采集、頻譜顯示)以及大規(guī)模數(shù)據(jù)計算(如FFT、ADPCM 編碼)等。整個系統(tǒng)的設(shè)計中模塊化思想貫穿始終,采用菜單鍵選擇所用功能,系統(tǒng)流程圖如圖10 所示。
5 方案測試與結(jié)果
5.1 測試儀器
測試儀器包括直流穩(wěn)壓穩(wěn)流電源,型號為SG1733SB3A;60M 數(shù)字存儲示波器,型號為TektronixTDS1002;秒表。
5.2 方案測試與結(jié)果
5.2.1 語音存儲與回放效果測試
?。?)一名組員面對麥克風(fēng)以不同大小的聲音說話,錄下一段語音,記錄回放語音的效果,結(jié)果見表1.
?。?)由耳機(jī)輸入不同音量的立體聲音樂,錄下一段語音,記錄回放語音的效果,結(jié)果見表2.
5.2.2 語音存儲時間測試
?。?)由耳機(jī)不間斷地輸入立體聲音樂,啟用錄音模式,待系統(tǒng)顯示存儲器存滿后,回放語音,用秒表記錄語音回放最長時間,結(jié)果見表3.
(2)一名組員面對麥克風(fēng)不間斷地說話,啟用錄音模式,待系統(tǒng)顯示存儲器存滿后,回放語音,用秒表記錄語音回放最長時間,結(jié)果見表4.
5.2.3 語音頻譜分析及顯示測試
由耳機(jī)或麥克風(fēng)輸入一段語音信號,由揚聲器直接播放出來,同時在示波器上實時顯示頻譜。測試結(jié)果為當(dāng)播放的聲音變化時,可觀察到頻譜有相應(yīng)的明顯變化。
由于不能明確知道語音信號的實時頻率和幅度信息,故只對頻譜進(jìn)行了定性測試。
6總結(jié)
該系統(tǒng)設(shè)計方案實現(xiàn)了語音存儲及回放,最長存儲時間達(dá)2 min,回放語音效果清晰良好,并能在示波器上實時顯示語音頻譜。采用ADPCM 編碼在保證回放音質(zhì)的情況下,極大地提高了存儲器的利用率,并通過對語音信號采用分幀加窗的方法實現(xiàn)了短時頻譜分析。
另外,系統(tǒng)采取了一系列抗干擾措施以減小噪聲,如數(shù)字地與模擬地分開走線,在一點匯合;電源處采用一個10 μF和0.1 μF的電容并聯(lián)去耦;時鐘走線盡量短等。但系統(tǒng)在語音回放時仍存在一定的噪聲,尤其當(dāng)輸入語音音量較小時,噪聲更為明顯,這是本方案需要完善的地方。
評論