最新亚洲人成在线网址,欧美一级A片日韩

谷歌宣布開源Android語音識(shí)別轉(zhuǎn)錄工具 —— Live Transcribe的語音引擎

谷歌在其開源博客中宣布開源 Android 語音識(shí)別轉(zhuǎn)錄工具 —— Live Transcribe 的語音引擎（Live Transcribe Speech Engine），它旨在將語音或?qū)υ拰?shí)時(shí)轉(zhuǎn)錄為文字，還能夠?yàn)槁犝先耸刻峁椭?/p>

Live Transcribe 是谷歌于今年 2 月推出的一款 Android 應(yīng)用程序，它的語音識(shí)別由谷歌最先進(jìn)的 Cloud Speech API 提供。但是，依賴于云引入了一些復(fù)雜性，不斷變化的網(wǎng)絡(luò)連接、數(shù)據(jù)成本和延遲的魯棒性等等都帶來一些考驗(yàn)。因此，谷歌把它開源出來，希望開發(fā)人員在已有的基礎(chǔ)上進(jìn)一步構(gòu)建和開發(fā)。

Cloud Speech API 目前無法支持無限的音頻流，團(tuán)隊(duì)目前采取了一些措施來解決這一難題，例如在達(dá)到超時(shí)之前關(guān)閉并重新啟動(dòng)流式傳輸請(qǐng)求，這將有效減少會(huì)話中丟失的文本量。

無限流媒體音頻帶來了一大挑戰(zhàn)。在許多國(guó)家，網(wǎng)絡(luò)數(shù)據(jù)非常昂貴，并且在互聯(lián)網(wǎng)較差的地方，帶寬可能有限。Live Transcribe Speech Engine 的團(tuán)隊(duì)對(duì)音頻編解碼器進(jìn)行了大量實(shí)驗(yàn)，并最終在不影響精度的情況下將數(shù)據(jù)使用量減少了 10 倍。

另外，由于是提供實(shí)時(shí)語音轉(zhuǎn)錄，轉(zhuǎn)錄出來的文本會(huì)隨著語音的輸入不斷發(fā)生變化，降低延遲自然十分必要。該引擎能夠大大降低延遲率，這都要?dú)w功于它的自定義 Opus 編碼器。

此外，值得一提的是，Live Transcribe 支持超過 70 種語言，并能夠根據(jù)語音自動(dòng)識(shí)別語種，其中也包括中文。

聲明：本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人，不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用，如有內(nèi)容侵權(quán)或者其他違規(guī)問題，請(qǐng)聯(lián)系本站處理。舉報(bào)投訴