語音聽寫,是指將短音頻(≤60秒)精準(zhǔn)識別成文字,實時返回結(jié)果,達(dá)到邊說邊返回的效果。
除了要考慮本身語音聽寫模型或算法的識別準(zhǔn)確率之外,一些智能硬件的產(chǎn)品還需要額外考慮降噪、回聲消除、去混響等因素,這些都是保證最后識別效果的重要因素。因為涉及軟硬件,對能力交付方的項目經(jīng)驗提出了較高的要求。
目前,國內(nèi)提供語音聽寫技術(shù)的廠商主要有:
1、科大訊飛
成立于1999年,2008年,公司在深圳證券交易所掛牌上市(股票代碼:002230)。一直深耕在人工智能領(lǐng)域,技術(shù)很全也很綜合,多次在語音識別、語音合成、機(jī)器翻譯、圖文識別、圖像理解、閱讀理解、機(jī)器推理等各項國際評測中取得佳績。
在語音聽寫上,除中文普通話和英文外,支持51個語種、24種方言和1個民族語言,可提供公有云接口及私有化部署方案。采用行業(yè)先進(jìn)的語音識別技術(shù),識別率可達(dá)98% 。目前廣泛應(yīng)用于語音搜索、聊天輸入、游戲娛樂、人機(jī)交互等場景。
2、百度
該技術(shù)主要由百度智能云提供,可適用于手機(jī)語音輸入、智能語音交互、語音指令、語音搜索等短語音交互場景。近場中文普通話識別準(zhǔn)確率達(dá)98%,在語言支持上覆蓋主流的普通話、口音普通話、粵語、四川話、英語。
3、云知聲
2012年6月創(chuàng)立于北京,是國內(nèi)頭部人工智能獨角獸企業(yè)。語音聽寫主要應(yīng)用于語音搜索、語音輸入、語音控制等場景。準(zhǔn)確率可達(dá)實用標(biāo)準(zhǔn),支持普通話、四川話、粵語、英語的識別。
4、思必馳
07年創(chuàng)立于英國劍橋,08年回國落戶蘇州,12年完成A輪融資,是國內(nèi)專業(yè)的對話式人工智能平臺公司,擁有全鏈路的智能語音語言技術(shù)。語音識別提供基于云+端混合引擎的連續(xù)語音識別,覆蓋中文、英文、葡萄牙語等語種,粵、川、滬等方言,以及帶方言的普通話。云端連續(xù)實時語音識別率>97%,可提供公有云接口及私有化部署方案。
審核編輯:符乾江
-
語音識別
+關(guān)注
關(guān)注
39文章
1780瀏覽量
114221 -
人工智能
+關(guān)注
關(guān)注
1806文章
49011瀏覽量
249371
發(fā)布評論請先 登錄
運算放大器的噪聲主要有哪些
plc的編程語言主要有哪三種
Aigtek功率放大器主要有哪些技術(shù)指標(biāo)呢

液晶顯示屏原材料主要有哪些
共模干擾產(chǎn)生的原因主要有哪些
二極管主要有哪些作用

車載傳感器主要有哪些傳感器
熱敏電阻主要有哪三種類型
集成電路設(shè)計流程主要有哪些步驟
linux驅(qū)動程序主要有哪些功能
直流電源主要有哪三個環(huán)節(jié)?每個環(huán)節(jié)的作用是什么?
SMT錫膏鋼網(wǎng)的清洗工藝主要有哪些?

評論