chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

谷歌宣布開源Android語音識(shí)別轉(zhuǎn)錄工具 —— Live Transcribe的語音引擎

SwM2_ChinaAET ? 來源:lq ? 2019-10-01 17:03 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

谷歌在其開源博客中宣布開源 Android 語音識(shí)別轉(zhuǎn)錄工具 —— Live Transcribe 的語音引擎(Live Transcribe Speech Engine),它旨在將語音或?qū)υ拰?shí)時(shí)轉(zhuǎn)錄為文字,還能夠?yàn)槁犝先耸刻峁椭?/p>

Live Transcribe 是谷歌于今年 2 月推出的一款 Android 應(yīng)用程序,它的語音識(shí)別由谷歌最先進(jìn)的 Cloud Speech API 提供。但是,依賴于云引入了一些復(fù)雜性,不斷變化的網(wǎng)絡(luò)連接、數(shù)據(jù)成本和延遲的魯棒性等等都帶來一些考驗(yàn)。因此,谷歌把它開源出來, 希望開發(fā)人員在已有的基礎(chǔ)上進(jìn)一步構(gòu)建和開發(fā)。

Cloud Speech API 目前無法支持無限的音頻流,團(tuán)隊(duì)目前采取了一些措施來解決這一難題,例如在達(dá)到超時(shí)之前關(guān)閉并重新啟動(dòng)流式傳輸請(qǐng)求,這將有效減少會(huì)話中丟失的文本量。

無限流媒體音頻帶來了一大挑戰(zhàn)。在許多國(guó)家,網(wǎng)絡(luò)數(shù)據(jù)非常昂貴,并且在互聯(lián)網(wǎng)較差的地方,帶寬可能有限。Live Transcribe Speech Engine 的團(tuán)隊(duì)對(duì)音頻編解碼器進(jìn)行了大量實(shí)驗(yàn),并最終在不影響精度的情況下將數(shù)據(jù)使用量減少了 10 倍。

另外,由于是提供實(shí)時(shí)語音轉(zhuǎn)錄,轉(zhuǎn)錄出來的文本會(huì)隨著語音的輸入不斷發(fā)生變化,降低延遲自然十分必要。該引擎能夠大大降低延遲率,這都要?dú)w功于它的自定義 Opus 編碼器。

此外,值得一提的是,Live Transcribe 支持超過 70 種語言,并能夠根據(jù)語音自動(dòng)識(shí)別語種,其中也包括中文。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 解碼器
    +關(guān)注

    關(guān)注

    9

    文章

    1204

    瀏覽量

    42877
  • 谷歌
    +關(guān)注

    關(guān)注

    27

    文章

    6246

    瀏覽量

    110284
  • 語音識(shí)別
    +關(guān)注

    關(guān)注

    39

    文章

    1804

    瀏覽量

    115583

原文標(biāo)題:【業(yè)內(nèi)熱點(diǎn)】谷歌開源實(shí)時(shí)語音轉(zhuǎn)錄引擎 Live Transcribe Speech Engine

文章出處:【微信號(hào):ChinaAET,微信公眾號(hào):電子技術(shù)應(yīng)用ChinaAET】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    語音識(shí)別芯片有哪些(語音識(shí)別芯片AT680系列)

    在人工智能技術(shù)飛速發(fā)展的今天,語音識(shí)別芯片作為人機(jī)交互的重要橋梁,正逐漸成為各類智能設(shè)備不可或缺的核心部件。與傳統(tǒng)的語音芯片不同,語音識(shí)別
    的頭像 發(fā)表于 11-14 17:11 ?1041次閱讀

    廣州唯創(chuàng)電子WTK6900H-32N語音識(shí)別芯片:智能語音控制賦能LED燈帶創(chuàng)新應(yīng)用 | 語音IC廠家

    芯片,憑借其卓越的性能和精準(zhǔn)的識(shí)別能力,在LED燈帶控制領(lǐng)域展現(xiàn)出強(qiáng)大的應(yīng)用價(jià)值,為智能照明系統(tǒng)帶來了革命性的創(chuàng)新突破。一、核心技術(shù)優(yōu)勢(shì)1.1高性能語音識(shí)別引擎WT
    的頭像 發(fā)表于 11-04 08:53 ?475次閱讀
    廣州唯創(chuàng)電子WTK6900H-32N<b class='flag-5'>語音</b><b class='flag-5'>識(shí)別</b>芯片:智能<b class='flag-5'>語音</b>控制賦能LED燈帶創(chuàng)新應(yīng)用 | <b class='flag-5'>語音</b>IC廠家

    什么是離線語音識(shí)別芯片(離線語音識(shí)別芯片有哪些優(yōu)點(diǎn))

    離線語音識(shí)別芯片,是一種集成了語音信號(hào)采集、前端處理和本地識(shí)別功能的專用集成電路,無須聯(lián)網(wǎng)也可以進(jìn)行語音控制。它內(nèi)設(shè)先進(jìn)的數(shù)字信號(hào)處理模塊及
    的頭像 發(fā)表于 10-31 15:27 ?286次閱讀

    如何選擇合適的語音識(shí)別芯片型號(hào)

    語音識(shí)別芯片(又稱語音識(shí)別IC)是現(xiàn)代智能設(shè)備的核心組件,與傳統(tǒng)語音芯片相比,其最大特點(diǎn)是能夠主動(dòng)識(shí)別
    的頭像 發(fā)表于 10-30 16:32 ?469次閱讀

    基于開源鴻蒙的語音識(shí)別語音合成應(yīng)用開發(fā)樣例

    本期內(nèi)容由AI Model SIG提供,介紹了在開源鴻蒙中,利用sherpa_onnx開源三方庫進(jìn)行ASR語音識(shí)別與TTS語音合成應(yīng)用開發(fā)的
    的頭像 發(fā)表于 08-25 14:26 ?3629次閱讀
    基于<b class='flag-5'>開源</b>鴻蒙的<b class='flag-5'>語音</b><b class='flag-5'>識(shí)別</b>及<b class='flag-5'>語音</b>合成應(yīng)用開發(fā)樣例

    瑞芯微RK3576語音識(shí)別算法

    1.語音識(shí)別簡(jiǎn)介語音識(shí)別技術(shù),也被稱為自動(dòng)語音識(shí)別(AutomaticSpeechRecogni
    的頭像 發(fā)表于 08-15 15:13 ?1874次閱讀
    瑞芯微RK3576<b class='flag-5'>語音</b><b class='flag-5'>識(shí)別</b>算法

    語音識(shí)別---大家怎么看呢?

    語音識(shí)別是一門交叉學(xué)科。近二十年來,語音識(shí)別技術(shù)取得顯著進(jìn)步,開始從實(shí)驗(yàn)室走向市場(chǎng)。人們預(yù)計(jì),未來10年內(nèi),語音
    發(fā)表于 08-09 10:54

    廣和通發(fā)布自研端側(cè)語音識(shí)別大模型FiboASR

    7月,全球領(lǐng)先的無線通信模組及AI解決方案提供商廣和通,發(fā)布其自主研發(fā)的語音識(shí)別大模型FiboASR。該模型專為端側(cè)設(shè)備上面臨的面對(duì)面實(shí)時(shí)對(duì)話及多人會(huì)議場(chǎng)景深度優(yōu)化,在低延遲語音交互、實(shí)時(shí)語音
    的頭像 發(fā)表于 08-04 11:43 ?1381次閱讀

    EASY EAl Orin Nano(RK3576) whisper語音識(shí)別訓(xùn)練部署教程

    1Whisper簡(jiǎn)介Whisper是OpenAI開源的,識(shí)別語音識(shí)別能力已達(dá)到人類水準(zhǔn)自動(dòng)語音識(shí)別
    的頭像 發(fā)表于 07-25 15:21 ?579次閱讀
    EASY EAl Orin Nano(RK3576) whisper<b class='flag-5'>語音</b><b class='flag-5'>識(shí)別</b>訓(xùn)練部署教程

    EASY EAl Orin Nano(RK3576) whisper語音識(shí)別訓(xùn)練部署教程

    Whisper是OpenAI開源的,識(shí)別語音識(shí)別能力已達(dá)到人類水準(zhǔn)自動(dòng)語音識(shí)別系統(tǒng)。Whispe
    的頭像 發(fā)表于 07-17 14:55 ?1473次閱讀
    EASY EAl Orin Nano(RK3576) whisper<b class='flag-5'>語音</b><b class='flag-5'>識(shí)別</b>訓(xùn)練部署教程

    明遠(yuǎn)智睿SSD2351開發(fā)板:語音機(jī)器人領(lǐng)域的變革力量

    。 開發(fā)板支持浮點(diǎn)運(yùn)算,這對(duì)于語音信號(hào)處理中的精確計(jì)算至關(guān)重要。在語音識(shí)別過程中,需要對(duì)語音信號(hào)的頻率、幅度等參數(shù)進(jìn)行精確計(jì)算和分析,浮點(diǎn)運(yùn)算能夠確保計(jì)算結(jié)果的準(zhǔn)確性,從而提高
    發(fā)表于 05-28 11:36

    語音識(shí)別技術(shù)在通信領(lǐng)域中的應(yīng)用實(shí)例

    語音識(shí)別技術(shù)也被稱為自動(dòng)語音識(shí)別(Automatic Speech Recognition,ASR),是通過計(jì)算機(jī)對(duì)語音信號(hào)進(jìn)行分析和
    的頭像 發(fā)表于 02-21 17:12 ?1079次閱讀

    詳解語音識(shí)別技術(shù)在通信領(lǐng)域中的應(yīng)用

    語音識(shí)別技術(shù)也被稱為自動(dòng)語音識(shí)別(Automatic Speech Recognition,ASR),是通過計(jì)算機(jī)對(duì)語音信號(hào)進(jìn)行分析和
    的頭像 發(fā)表于 02-21 17:05 ?1036次閱讀
    詳解<b class='flag-5'>語音</b><b class='flag-5'>識(shí)別</b>技術(shù)在通信領(lǐng)域中的應(yīng)用

    空調(diào)語音控制方案NRK3501語音識(shí)別芯片-讓智能生活觸手可及!

    NRK3501語音識(shí)別芯片支持離線語音控制空調(diào),精準(zhǔn)識(shí)別,遠(yuǎn)場(chǎng)降噪,最多支持200條離線指令,5米內(nèi)識(shí)別率92%,讓智能家居更便捷舒適。
    的頭像 發(fā)表于 01-07 11:40 ?1277次閱讀
    空調(diào)<b class='flag-5'>語音</b>控制方案NRK3501<b class='flag-5'>語音</b><b class='flag-5'>識(shí)別</b>芯片-讓智能生活觸手可及!

    基于語音識(shí)別的智能會(huì)議系統(tǒng)具備哪些交互功能

    標(biāo)貝科技專注智能語音交互領(lǐng)域多年,在語音識(shí)別語音合成領(lǐng)域有著多項(xiàng)大型企業(yè)合作案例,標(biāo)貝與多個(gè)智能會(huì)議系統(tǒng)廠商合作,成功將語音
    的頭像 發(fā)表于 12-20 10:35 ?903次閱讀