錘子科技在15日堅果TNT工作站發(fā)布之后,表情包們集體炸了。
噓,你不要講話,吵到我用TNT了
這個表情包吐槽的是9999元起的TNT工作站的工作場景,因為大部分操作需要用到觸控+語音識別功能,在背景嘈雜的辦公室,你很難讓語音清晰識別到你的聲音,在各種干擾下你的操作精度將會大打折扣。所以網(wǎng)上還有個段子表示,如果要用TNT工作站來設(shè)計,老板必須給每個設(shè)計師安排單獨(dú)的隔音辦公室。其實這種情況在目前普遍搭載人工語音智能的設(shè)備如手機(jī)、音箱中很難普遍,只要稍微有人聲干預(yù)就會讓你的siri識別率大跌。
不過噪音問題其實比你想象中的容易解決,對于羅永浩和錘子科技來說,或許欠缺的只是一顆小小的降噪芯片。
傳統(tǒng)的音頻降噪方式
目前智能手機(jī)中對于環(huán)境噪音的處理主要有兩種方式:第一種是通過多MIC實現(xiàn)降噪功能。這種方式需要配備降噪MIC,對于用戶的使用手勢要求很高。如果降噪MIC剛好壓住用戶的臉部,或者在耳機(jī)模式下都無法獲得降噪效果,在使用免提模式的時候也會有影響。
第二種是通過在終端設(shè)備內(nèi)置場景降噪的軟件,通過算法來實現(xiàn)降噪。這對于終端計算能力有很高要求,一方面對于環(huán)境噪聲的樣本數(shù)量有限,另一方面,噪聲樣本越多,終端的判斷時間就會越長,最終影響用戶體驗。畢竟用戶希望對話是能夠迅速反應(yīng)的。
這兩種傳統(tǒng)的降噪方式都具有各種缺陷,在具體的降噪效果上也是差強(qiáng)人意。
通過AI識別場景,智能降噪
更好的方式是采用獨(dú)立的降噪芯片來進(jìn)行降噪。來自***的意騰科技通過一顆搭載AI算法的降噪芯片來實現(xiàn)降噪功能。這種方式的好處是不再需要多個MIC來處理,只需要單MIC就能保證通話模式中實現(xiàn)清晰的語音。此外,這種方式也不需要對噪聲樣本進(jìn)行搜索匹配。
這顆降噪芯片其中的核心是一顆專為語音降噪設(shè)計的AI處理器,通過3層深度學(xué)習(xí)網(wǎng)絡(luò)(DNN網(wǎng)絡(luò))實現(xiàn)對原始聲音的處理輸出,其中每層網(wǎng)絡(luò)擁有1028個節(jié)點。此外,這顆AI處理器的運(yùn)算能力可以達(dá)到1012 ops/W,可以針對特別壓縮的聲音信號實現(xiàn)計算處理。
通過這顆降噪芯片,之所以不需要對噪聲樣本進(jìn)行搜索匹配。主要是因為這顆AI處理器對超過4億個語音資料樣本(包括2億外文語音樣本)進(jìn)行了機(jī)器學(xué)習(xí),可通過DNN網(wǎng)絡(luò)迅速自行找到每段音頻最合適的模型和參數(shù)??蓪崿F(xiàn)智能識別包括餐廳/集會場所、公交地鐵火車站、風(fēng)噪、音樂噪聲等各個噪聲場景。
降噪前后效果對比
通過智能場景識別實現(xiàn)的降噪功能有多牛逼?讓我們來通過噪聲處理前后的音頻來實際對比一下:
一般來說,業(yè)界都采用SNR(信噪比)來判斷降噪功能,SNR是按照國際標(biāo)準(zhǔn)ISO 4969-2檢測的單值降噪值。設(shè)備的信噪比越高表明它產(chǎn)生的雜音越少。從圖表對比中可以看到,經(jīng)過降噪處理后的SNR實現(xiàn)了大幅度的提升。
據(jù)了解,目前意騰科技的降噪音頻芯片一共四個型號,分別對應(yīng)IG200、IG1201、IG1100、IG1102。目前實現(xiàn)的主要功能還是通話降噪和近距離喚醒。此外,目前實現(xiàn)的本地存儲的關(guān)鍵詞達(dá)到4組,預(yù)計到Q3會升到10組,通過是支持立體聲AEC以及beamforming功能。預(yù)計到Q4會推出帶聲紋識別功能的降噪芯片,這樣的話你就再也不用擔(dān)心下面這個段子的情況會發(fā)生了:
“我悄悄來到賣力工作的設(shè)計師小王身后,說一句全部刪除,小王的心血付之東流?!?/p>
最后介紹一下這顆芯片的供應(yīng)商意騰科技。這家公司的CEO從事半導(dǎo)體行業(yè)30年+,之前創(chuàng)立的耀鵬科技曾是三星手機(jī)供應(yīng)商。主要研發(fā)團(tuán)隊從2013年開始就研究AI語音降噪算法,目前意騰科技也獲得了MTK的投資。值得注意的是,目前高通是采用將AI降噪算法植入到SOC的方式來實現(xiàn)降噪,但這對于SOC的性能和功耗要求頗高,未來是否會采用單獨(dú)的AI芯片來進(jìn)行處理,還有待觀察。
最后,筆者認(rèn)為未來語音交互將會成為一種重要的交互手段,TNT的構(gòu)想在技術(shù)的進(jìn)步之下未必不能實現(xiàn)。讓我們對產(chǎn)品創(chuàng)新保持一定的寬容和好奇心。
-
AI
+關(guān)注
關(guān)注
88文章
35164瀏覽量
280055 -
語音識別
+關(guān)注
關(guān)注
39文章
1782瀏覽量
114249
原文標(biāo)題:這顆芯片安利給羅永浩,再不用擔(dān)心用TNT被吵到了
文章出處:【微信號:gh_bee81f890fc1,微信公眾號:面包板社區(qū)】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
發(fā)布評論請先 登錄
AP-0316 語音模組:不止是降噪神器,更是即插即用的 USB 聲卡全能王
A-29P AI智能降噪回音消除模塊說明書
AI神經(jīng)網(wǎng)絡(luò)降噪算法在語音通話產(chǎn)品中的應(yīng)用優(yōu)勢與前景分析

BOYA博雅發(fā)布BOYAMIC 2 BOYALINK 3,AI降噪重新定義無線音頻純凈時代

杰理科技JL7083F芯片賦能QCY H3 Pro頭戴式降噪耳機(jī)
XMOS人工智能降噪——AI降噪讓極端嘈雜環(huán)境下的通話和拾音變得可能

珠海杰理AC/JL7006F, JL7018F頭戴耳機(jī)系列芯片
珠海杰理JL700N, JL701N ,TWS耳機(jī)系列芯片
降噪技術(shù)在電子設(shè)備中的應(yīng)用
新品發(fā)布:NR60降噪音頻處理模塊-近距離人聲識別近場降噪

使用TLV320AIC3256做藍(lán)牙主動降噪耳機(jī),存在一個功耗無法達(dá)到要求的問題求解
請問啟用AIC3104本身降噪功能,有什么需要注意的地方?
想通過使用AIC3254降噪,在purepath中的算法模塊中哪個比較合適呢?
tlv320aic3104在Line IN沒有輸入的時候,底噪有點偏大,是否有辦法做降噪處理?
語音降噪 -音頻技術(shù)的一個重要話題

評論