聲音其實(shí)是一種能量波,因此也有頻率和振幅的特征,頻率對(duì)應(yīng)于時(shí)間軸線,振幅對(duì)應(yīng)于電平軸線。我們知道,在可聽(tīng)見(jiàn)的聲音中,話音信號(hào)的頻段在80Hz到3400Hz之間,音樂(lè)信號(hào)的頻段在20Hz-20kHz之間,語(yǔ)音(話音)和音樂(lè)是多媒體技術(shù)重點(diǎn)處理的對(duì)象。通常人耳可以聽(tīng)到的頻率在20Hz到20KHz的聲波稱(chēng)為為可聽(tīng)聲,低于20Hz的成為次聲,高于20KHz的為超聲,多媒體技術(shù)中只研究可聽(tīng)聲部分。
一:數(shù)字化音頻的三個(gè)主要步驟
由于模擬聲音在時(shí)間上是連續(xù)的,麥克風(fēng)采集的聲音信號(hào)還需要經(jīng)過(guò)數(shù)字化處理后才能由計(jì)算機(jī)處理。通常我們采用PCM編碼(脈沖代碼調(diào)制編碼),即通過(guò)采樣、量化、編碼三個(gè)步驟將連續(xù)變化的模擬信號(hào)轉(zhuǎn)換為數(shù)字編碼。
1、采樣
采樣,就是每隔一段時(shí)間間隔讀一次聲音的幅度。單位時(shí)間內(nèi)采樣的次數(shù)稱(chēng)為采樣頻率。顯然采樣頻率越高,所得到的離散幅值的數(shù)據(jù)點(diǎn)就越逼近于連續(xù)的模擬音頻信號(hào)曲線,同時(shí)采樣的數(shù)據(jù)量也越大。
為了保證數(shù)字化的音頻能夠準(zhǔn)確(可逆)地還原成模擬音頻進(jìn)行輸出,采樣定理要求:采樣頻率必須大于等于模擬信號(hào)頻譜中的最高頻率的2倍。
常用的音頻采樣率有:8kHz、11.025kHz、22.05kHz、16kHz、37.8kHz、44.1kHz、48kHz。
例如:話音信號(hào)頻率在0.3~3.4kHz范圍內(nèi),用8kHz的抽樣頻率(fs),就可獲得能取代原來(lái)連續(xù)話音信號(hào)的抽樣信號(hào),而一般CD采集采樣頻率為44.1kHz。
2、量化
量化,就是把采樣得到的聲音信號(hào)幅度轉(zhuǎn)換成數(shù)字值,用于表示信號(hào)強(qiáng)度。
量化精度:用多少個(gè)二進(jìn)位來(lái)表示每一個(gè)采樣值,也稱(chēng)為量化位數(shù)。聲音信號(hào)的量化位數(shù)一般是 4,6,8,12或16 bits 。
由采樣頻率和量化精度可以知道,相對(duì)自然界的信號(hào),音頻編碼最多只能做到無(wú)限接近,在計(jì)算機(jī)應(yīng)用中,能夠達(dá)到最高保真水平的就是PCM編碼,通常PCM約定俗成了無(wú)損編碼。
3、編碼
一個(gè)采樣率為44.1kHz,量化精度為16bit,雙聲道的PCM編碼輸出,它的數(shù)據(jù)速率則為 44.1K×16×2 =1411.2 Kbps,存儲(chǔ)一秒鐘需要176.4KB的空間,1分鐘則約為10.34M,因此,為了降低傳輸或存儲(chǔ)的費(fèi)用,就必須對(duì)數(shù)字音頻信號(hào)進(jìn)行編碼壓縮。
到目前為止,音頻信號(hào)經(jīng)壓縮后的數(shù)碼率降低到32至256kbit/s,語(yǔ)音可以低至8kbit/s以下。
對(duì)數(shù)字音頻信息的編碼進(jìn)行壓縮的目的是在不影響人們使用的情況下使數(shù)字音頻信息的數(shù)據(jù)量最少。通常用如下6個(gè)屬性來(lái)衡量:
—比特率;
—信號(hào)的帶寬;
—主觀/客觀的語(yǔ)音質(zhì)量;
—延遲;
—計(jì)算復(fù)雜度和對(duì)存儲(chǔ)器的要求;
—對(duì)于通道誤碼的靈敏度;
為使編碼后的音頻信息可以被廣泛地使用,在進(jìn)行音頻信息編碼時(shí)需要采用標(biāo)準(zhǔn)的算法。傳統(tǒng)會(huì)議電視設(shè)備主要采用ITU-T推薦的G.711、G.722、G.728和AAC_LD等音頻標(biāo)準(zhǔn)。
在音頻設(shè)備的介紹里面會(huì)經(jīng)??吹?a target="_blank">產(chǎn)品資料里有各式各樣所支持的音頻格式和協(xié)議,下面我們來(lái)詳細(xì)講解下藍(lán)牙耳機(jī)、會(huì)議電視的常用音頻協(xié)議。
編輯推薦:音頻、視頻領(lǐng)域相關(guān)國(guó)際標(biāo)準(zhǔn)有哪些
?
藍(lán)牙耳機(jī)常用音頻協(xié)議有哪些

HFP:HFP(Hands-free Profile),讓藍(lán)牙設(shè)備可以控制電話,如接聽(tīng)、掛斷、拒接、語(yǔ)音撥號(hào)等,拒接、語(yǔ)音撥號(hào)要視藍(lán)牙耳機(jī)及電話是否支持。汽車(chē)內(nèi)的汽車(chē)套件是常見(jiàn)的使用情景。汽車(chē)套件將連接至手機(jī)并用于撥打和接聽(tīng)電話。將無(wú)線耳機(jī)連接至手機(jī)后使用耳機(jī)撥打和接聽(tīng)電話則更為常見(jiàn)。
HSP:耳機(jī)模式(HSP)用于支持藍(lán)牙耳機(jī)與移動(dòng)電話之間使用免提模式(HFP)常用來(lái)讓車(chē)用免提溝通與車(chē)內(nèi)移動(dòng)電話
A2DP:A2DP全名是Advanced Audio Distribution Profile 藍(lán)牙音頻傳輸模型協(xié)定! A2DP是能夠采用耳機(jī)內(nèi)的芯片來(lái)堆棧數(shù)據(jù),達(dá)到聲音的高清晰度。然而并非支持A2DP的耳機(jī)就是蘭阿姨耳機(jī)立體聲,立體聲實(shí)現(xiàn)的基本要求是雙聲道,所以單聲道的藍(lán)牙耳機(jī)是不能實(shí)現(xiàn)立體聲的。聲音能達(dá)到44.1kHz,一般的耳機(jī)只能達(dá)到8kHz。如果手機(jī)支持藍(lán)牙,只要裝載A2DP協(xié)議,就能使用A2DP耳機(jī)了。還有消費(fèi)者看到技術(shù)參數(shù)提到藍(lán)牙V1.0 V1.1 V1.2 V2.0——這些是指藍(lán)牙的技術(shù)版本,是指通過(guò)藍(lán)牙傳輸?shù)乃俣?,他們是否支持A2DP具體要看藍(lán)牙產(chǎn)品制造商是否使用這個(gè)技術(shù)。
AVRCP:AVRCP 設(shè)計(jì)用于提供控制TV、Hi-Fi設(shè)備等的標(biāo)準(zhǔn)接口。此配置文件用于許可單個(gè)遠(yuǎn)程控制設(shè)備(或其它設(shè)備)控制所有用戶(hù)可以接入的A/V設(shè)備。它可以與 A2DP 或 VDP 配合使用。AVRCP 定義了如何控制流媒體的特征。包括暫停、停止、啟動(dòng)重放、音量控制及其它類(lèi)型的遠(yuǎn)程控制操作。AVRCP 定義了兩個(gè)角色,即控制器和目標(biāo)設(shè)備。
APTX:AptX是一種壓縮技術(shù),好比是ALAC,本身是支持無(wú)損的,但是被用在藍(lán)牙技術(shù)中的時(shí)候,由于種種原因,還是有損,只不過(guò)屬于比較高碼率的有損。
OPP
藍(lán)牙通信程序部分需采用用于設(shè)備之間傳輸數(shù)據(jù)對(duì)象OPP Profile: Object Push Profile由于OPP profile又細(xì)分為OPPC (client)端和OPPS(server)端profile,這兩個(gè)profile區(qū)別在于只有client端可以發(fā)起數(shù)據(jù)傳輸?shù)倪^(guò)程,但是附件設(shè)備與手機(jī)通信的情景中,既有手機(jī)發(fā)起數(shù)據(jù)傳輸請(qǐng)求也有設(shè)備側(cè)發(fā)起傳輸請(qǐng)求的需要,所以要在設(shè)備中實(shí)現(xiàn)OPPC和OPPS兩個(gè)profile。
PBAP
電話號(hào)碼簿訪問(wèn)協(xié)議(Phonebook Access Profile)
會(huì)議電視常用音頻協(xié)議有哪些

1、 ITU-T G.728
1992年ITU-T發(fā)布的電話聲音信號(hào)編碼方式推薦標(biāo)準(zhǔn)。采用LD-CELP編碼方式,采樣率為8KHz,以16kb/秒的速度傳送聲音信號(hào),傳送延遲時(shí)間極短,僅有0.625 ms 的算法編碼延遲。
2、 ITU-T G.711
標(biāo)準(zhǔn)公布于1972年,其語(yǔ)音信號(hào)編碼是非均勻量化PCM。語(yǔ)音的采樣率為8KHz,每個(gè)樣值采用8bit量化,輸出的數(shù)據(jù)率為64kbps。這種窄帶編碼支持對(duì)300到 3,400赫茲的音頻進(jìn)行壓縮。但雖然壓縮質(zhì)量不錯(cuò),但是消耗的帶寬相對(duì)較大,主要用于數(shù)字PBX/ISDN上的數(shù)字式電話。
3、 ITU-T G.722
ITU-T G.722標(biāo)準(zhǔn)是第一個(gè)用于 16 KHZ 采樣率的標(biāo)準(zhǔn)化寬帶語(yǔ)音編碼算法,1984年被CCITT定義為標(biāo)準(zhǔn),而且現(xiàn)今還在使用。.G.722 編解碼器在 16 kHz 頻率上接收 16 位數(shù)據(jù)(帶寬從 50 Hz 至 7 kHz),并將其壓縮為 64、56 與 48 Kbit/s,其總延遲約 3 ms,能夠提供更好的通話質(zhì)量。
G.722的優(yōu)點(diǎn)是延時(shí)和傳輸位誤差率非常低,且沒(méi)有任何的專(zhuān)利技術(shù),費(fèi)用低廉。因此G.722在無(wú)線通信系統(tǒng),VoIP生產(chǎn)商,個(gè)人通信服務(wù),視頻會(huì)議應(yīng)用等廣泛應(yīng)用。
4、 G.722.1
G.722.1基于 Polycom 的第三代 Siren 7 壓縮技術(shù),1999年被ITU-T批準(zhǔn)為G.722.1標(biāo)準(zhǔn)。G.722.1采用16 KHZ 采樣頻率,16 位數(shù)據(jù)量化,支持從 50 Hz 至 7 kHz頻率范圍的音頻采樣,并將其壓縮為 32 與 24 Kbit/s。它采用20 ms封幀,提供40ms的算法延遲。
G722.1可實(shí)現(xiàn)比 G.722 編解碼器更低的比特率以及更大的壓縮。目標(biāo)是以大約一半的比特率實(shí)現(xiàn)與 G.722 大致相當(dāng)?shù)馁|(zhì)量。這種編碼使用許可需要獲得Polycom公司的授權(quán)。
5、 G722.1 Annex C
G722.1 Annex C基于 Polycom 的Siren 14 壓縮技術(shù), 采用32kHz采樣頻率,支持從 50 Hz 至 14 kHz頻率范圍的音頻采樣,并將其壓縮為 24、32或48 kbps。采用20ms封幀,提供40毫秒演算延遲。
2005年中,國(guó)際電信聯(lián)盟(ITU)批準(zhǔn)Polycom Siren 14? 技術(shù)為14 kHz超寬帶音頻編碼新標(biāo)準(zhǔn)。同時(shí)進(jìn)入作為ITU-T建議的G.722.1 Annex C。 G722.1 Annex C具有低運(yùn)算能力,低帶寬的優(yōu)點(diǎn)。適于處理語(yǔ)音、音樂(lè)與自然界聲音。
6、 AAC-LD
AAC(Advanced Audio Coding,高級(jí)音頻編碼)是由Fraunhofer研究院(MP3格式的創(chuàng)造者)、杜比(DOLBY)試驗(yàn)室和AT&T(美國(guó)電話電報(bào)公司)共同研發(fā)出的一種音頻壓縮格式,是MPEG-2規(guī)范的一部分,并在1997年3月成為國(guó)際標(biāo)準(zhǔn)。隨著MPEG-4標(biāo)準(zhǔn)在2000年成型后,MPEG2 AAC也被作為核心編碼技術(shù),并增加了一些新的編碼特性,又叫MPEG-4 AAC。
MPEG-4 AAC家族目前共有九種編碼規(guī)格,AAC-LD(Low Delay,低延遲規(guī)格)是用在低碼率下編碼。它支持8K~48K采樣率的,可以64Kbps的碼率輸出接近 CD 音質(zhì)的音頻,并支持多聲音通道,AAC-LD 算法延遲僅為 20ms。
AAC因?yàn)槠淠K化設(shè)計(jì),功能更為強(qiáng)大。本身的框架結(jié)構(gòu)能夠被不斷的新的東西填充,這就使得不同發(fā)展方面的內(nèi)核相互融合,彼此吸收精華成為可能。
7、 各種音頻協(xié)議的主要參數(shù)對(duì)比:
采樣頻率 支持音頻帶寬 輸出碼率 最低算法延遲
G711 8KHz 300 Hz ~ 3,400 Hz 64 Kbps 《1ms
G722 16kHz 50 Hz ~ 7 kHz 64 Kbps 3ms
G722.1 16kHz 50 Hz ~7 kHz 24、32 Kbps 40ms
G722.1 C 32kHz 50 Hz~14 kHz 24、32、48Kbps 40ms
AAC-LD 48kHz 20 Hz-20kHz 48~64 Kbps 20ms
三、AAC_LD與G722. Annex C優(yōu)缺點(diǎn)對(duì)比:
G722.1 C AAC_LD
采樣音頻頻率范圍支持50 Hz~14 kHz,接近CD音質(zhì),但丟失了高頻部分。
支持20 Hz-20kHz全頻段的采樣,音頻更加接近CD音質(zhì)。
輸出碼率24、32、48Kbps,帶寬低于AAC-LD,但是以犧牲高頻為代價(jià)的。
48~64 Kbps,并支持大于64Kbps的輸出,為更好的音頻質(zhì)量提供了可能。
算法復(fù)雜性算法復(fù)雜度低,CPU占用率略好于AAC-LD 模塊化設(shè)計(jì),功能更為強(qiáng)大,有TI等專(zhuān)用芯片支持
最低延遲采用20ms封幀,40ms算法延遲 20ms算法延遲,好于G722.1 C
多聲道可以支持雙聲道 AAC支持多達(dá)48個(gè)音軌、15個(gè)低頻音軌
標(biāo)準(zhǔn)通用性G722.1-C 由Polycom制定開(kāi)發(fā),使用需要Polycom授權(quán),目前只有Polycom和極少數(shù)會(huì)議電視廠商使用。 作為MPEG4核心標(biāo)準(zhǔn),受到Apple、諾基亞、松下等支持,并被泰德等眾多會(huì)議電視廠商所采用,應(yīng)用前景更廣闊。
在相同的采樣頻率下,AAC-LD可以提供比G722.1 C、MP3等更好的音質(zhì)。AAC-LD實(shí)現(xiàn)了超寬頻音頻編碼中最短的延時(shí),并保證接近CD的音質(zhì),達(dá)到音質(zhì)、比特率和延時(shí)三者的最佳組合,是會(huì)議電視領(lǐng)域的最優(yōu)選擇。
編輯推薦:ADI公司談音頻系統(tǒng)標(biāo)準(zhǔn)和協(xié)議
評(píng)論