chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內(nèi)不再提示

云從科技打破世界紀錄 語音識別準確率達97.03%

cMdW_icsmart ? 來源:未知 ? 作者:胡薇 ? 2018-10-31 17:11 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

語音識別領域,全球科技企業(yè)的目標很一致,那就是想“超過人類”。之前科研界設定人類錯詞率為5.9%的這個界線,受過嚴格訓練的專業(yè)速記員錯詞率在3%左右,錯詞率(Worderrorrate,WER)是衡量語音識別技術水平的核心指標。

人類的界線已在2017年被微軟超過,而受過嚴格訓練的專業(yè)速記員則一直堅守著自己的底線。

然而這個紀錄也在這個10月被打破,2018年10月 29日,中國人工智能“國家隊”云從科技在語音識別技術上取得重大突破,他們?nèi)诤蠄D像識別與語音識別的優(yōu)勢,推出全新Pyramidal-FSMN語音識別模型。

在技術研究的「最后一公里」,每 0.1 個百分點的進步都異常艱難。全新Pyramidal-FSMN語音識別模型在全球最大的開源語音識別數(shù)據(jù)集Librispeech上刷新了世界紀錄,準確率提升到97.03%,將Librispeech的錯詞率(Worderrorrate,WER)降低至2.97%,超過阿里、百度、約翰霍普金斯大學等企業(yè)及高校,大幅刷新原先記錄。

DS2:百度,ESPnet:約翰霍普金斯大學,DFSMN-CE:阿里

云從科技并沒有把人臉識別作為唯一的“寶”來押注,這家孵化自中國科學院的企業(yè),并不是第一次取得這樣的技術突破。

2018年2月,云從科技正式在國內(nèi)首發(fā)“3D結構光人臉識別技術”。2018年4月,云從科技“跨鏡追蹤技術”(ReID)技術在Market-1501,DukeMTMC-reID,CUHK03三個數(shù)據(jù)集刷新了世界紀錄,其中最高在Market-1501上的首位命中率(Rank-1 Accuracy)達到96.6%,讓跨鏡追蹤技術(ReID)技術在準確率上首次達到商用水平,人工智能從「刷臉」跨到「識人」的新紀元。

語音識別技術同樣是智能感知中一個重要的部分,通過語音識別,機器就可以像人類一樣聽懂說話,進而能夠理解、思考與反饋。近年來,在深度學習技術的幫助下,語音識別取得了極大的進展,從實驗室開始走向市場,走向?qū)嵱没?。基于語音識別技術的輸入法、搜索和翻譯等人機交互場景都有了廣泛的應用。

智能感知 大數(shù)據(jù),是云從科技打造核心技術閉環(huán),領跑人工智能行業(yè)的利器。

據(jù)悉,此次技術突破是云從科技打造核心技術閉環(huán)路徑中的關鍵一步。此前,云從科技在10月12日發(fā)布了國家發(fā)改委“人工智能基礎資源公共服務平臺”項目,該平臺可以基于行業(yè)數(shù)據(jù)為各行各業(yè)提供人工智能智能感知及大數(shù)據(jù)服務,中國人民銀行、中國聯(lián)通、中國郵政、民航局、金山云等企業(yè)與機構與云從首批簽約。這個搭載人臉、人體、手勢、紅外、語音、車輛、風控、文字、大數(shù)據(jù)分析等多種方式為一體的人工智能平臺,云從傾注了大量的技術力量。

在平臺發(fā)布會上,云從科技創(chuàng)始人周曦提出了人工智能發(fā)展的五個階段,核心技術閉環(huán)是五個階段的重要基礎。云從科技在今年先后首發(fā)3D結構光人臉識別技術及刷新跨鏡追蹤技術三項世界紀錄,并在金融、安防、機場等優(yōu)勢行業(yè)建設基于智能分析的“行業(yè)大腦”,廣泛強化合作伙伴范圍,穩(wěn)步推進從核心技術到智能生態(tài)的五步走戰(zhàn)略。

目前,云從科技是中國銀行業(yè)第一大AI供應商。包括農(nóng)行、建行、中行、招行總行等全國400多家銀行已采用公司產(chǎn)品,為全國銀行提供對比服務日均2.16億次,同時為14.7萬家社會網(wǎng)點提供服務。

在安防領域,公司產(chǎn)品已在29個省級行政區(qū)上線實戰(zhàn),每天比對超過10億次,數(shù)據(jù)匯聚總量超過千億,協(xié)助全國公安抓獲超過1萬名犯罪嫌疑人;

在民航領域,已有60余家機場選擇云從產(chǎn)品,日服務旅客人數(shù)達到6千萬。

在這些基礎上,云從科技正在致力整合算力、智力、數(shù)據(jù)等資源及其成果,打造人工智能平臺,進一步促進人工智能在金融、安防、交通、零售、教育等重要行業(yè)的落地。

語音識別六十年,技術突破總是艱難而緩慢。

語音識別的研究起源可以追溯到上世紀50年代,AT&T貝爾實驗室的Audry系統(tǒng)率先實現(xiàn)了十個英文數(shù)字識別。

從上世紀60年代開始,CMU的Reddy開始進行連續(xù)語音識別的開創(chuàng)性工作。但是這期間進展緩慢,以至于貝爾實驗室的約翰·皮爾斯(John Pierce)認為語音識別是幾乎不可能實現(xiàn)的事情。

上世紀70年代,計算機性能的提升,以及模式識別基礎研究的發(fā)展,促進了語音識別的發(fā)展。IBM、貝爾實驗室相繼推出了實時的PC端孤立詞識別系統(tǒng)。

上世紀80年代是語音識別快速發(fā)展的時期,引入了隱馬爾科夫模型(HMM)。此時語音識別開始從孤立詞識別系統(tǒng)向大詞匯量連續(xù)語音識別系統(tǒng)發(fā)展。

上世紀90年代是語音識別基本成熟的時期,但是識別效果離實用化還相差甚遠,語音識別的研究陷入了瓶頸。

關鍵突破起始于2006年。這一年辛頓(Hinton)提出深度置信網(wǎng)絡(DBN),促使了深度神經(jīng)網(wǎng)絡(Deep Neural Network,DNN)研究的復蘇,掀起了深度學習的熱潮。

2009年,辛頓以及他的學生默罕默德(D. Mohamed)將深度神經(jīng)網(wǎng)絡應用于語音的聲學建模,在小詞匯量連續(xù)語音識別數(shù)據(jù)庫TIMIT上獲得成功。

2011年,微軟研究院俞棟、鄧力等發(fā)表深度神經(jīng)網(wǎng)絡在語音識別上的應用文章,在大詞匯量連續(xù)語音識別任務上獲得突破。國內(nèi)外巨頭大力開展語音識別研究。

2017年3月,IBM結合了 LSTM 模型和帶有 3 個強聲學模型的 WaveNet 語言模型?!凹袛U展深度學習應用技術終于取得了 5.5% 錯詞率的突破”。相對應的是去年5月的6.9%。

2017年8月,微軟發(fā)布新的里程碑,通過改進微軟語音識別系統(tǒng)中基于神經(jīng)網(wǎng)絡的聽覺和語言模型,在去年基礎上降低了大約12%的出錯率,錯詞率為5.1%。相對應的是去年10月的5.9%,聲稱超過人類。

2017年12月,谷歌發(fā)布全新端到端語音識別系統(tǒng)(State-of-the-art Speech Recognition With Sequence-to-Sequence Models),錯詞率降低至5.6%。相對于強大的傳統(tǒng)系統(tǒng)有 16% 的性能提升。

2018年6月,阿里巴巴達摩院推出了新一代語音識別模型DFSMN,將全球語音識別準確率紀錄提高至96.04%,錯詞率降低至3.96%。

2018年10月,云從科技發(fā)布全新Pyramidal-FSMN語音識別模型,錯詞率(Worderrorrate,WER)降低至2.97%,較之前提升了25%,將全球語音識別準確率紀錄提高至97.03%,超過受過嚴格訓練的專業(yè)人類速記員。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權轉載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 語音識別
    +關注

    關注

    39

    文章

    1804

    瀏覽量

    115576
  • 云從科技
    +關注

    關注

    1

    文章

    73

    瀏覽量

    10385

原文標題:一舉打破世界紀錄,云從科技將語音識別準確率提升到97.03%

文章出處:【微信號:icsmart,微信公眾號:芯智訊】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    晶科能源第31次打破電池效率和組件功率世界紀錄

    近日,全球領先的光伏企業(yè)晶科能源宣布,經(jīng)德國哈梅林太陽能研究所(ISFH)權威認證,基于TOPCon技術平臺的高效先進電池,最高光電轉換效率突破27.79%,再次刷新世界紀錄,實現(xiàn)第31次打破電池
    的頭像 發(fā)表于 11-24 15:00 ?311次閱讀

    什么是離線語音識別芯片(離線語音識別芯片有哪些優(yōu)點)

    指令的識別與響應。無論是在家庭還是嘈雜的工業(yè)場合,這一類芯片都可以實現(xiàn)高準確率的智能語音交互,這種離線控制方式為用戶提供了極大的便利。
    的頭像 發(fā)表于 10-31 15:27 ?281次閱讀

    除了準確率,電能質(zhì)量在線監(jiān)測裝置在諧波源識別方面還有哪些重要指標?

    除了識別準確率,電能質(zhì)量在線監(jiān)測裝置在諧波源識別方面的核心價值還依賴于 識別效率、定位精度、抗干擾能力、場景適配性 等關鍵指標,這些指標直接決定裝置能否在復雜現(xiàn)場環(huán)境中 “快速找對、精
    的頭像 發(fā)表于 10-22 16:22 ?791次閱讀

    電能質(zhì)量在線監(jiān)測裝置識別諧波源的準確率有多高?

    電能質(zhì)量在線監(jiān)測裝置識別諧波源的準確率受電網(wǎng)結構、監(jiān)測方案、設備性能等多重因素影響,呈現(xiàn)顯著的 場景化差異 。根據(jù)行業(yè)研究與工程實踐,其準確率通常在 **65%~95%** 之間波動,具體可分為以下
    的頭像 發(fā)表于 10-22 16:18 ?688次閱讀

    165Hz 超高刷東方屏打破 9 項世界紀錄,一加攜手京東方開啟中國屏幕的刷新時刻

    10月14日,一加攜手京東方正式發(fā)布第三代東方屏。作為全球首塊165Hz超高刷高分辨屏幕,第三代東方屏以8項技術突破刷新9項世界紀錄,在流暢度、顯示素質(zhì)、暗光顯示、護眼能力四大維度帶來引領行業(yè)
    的頭像 發(fā)表于 10-15 09:15 ?591次閱讀
    165Hz 超高刷東方屏<b class='flag-5'>打破</b> 9 項<b class='flag-5'>世界紀錄</b>,一加攜手京東方開啟中國屏幕的刷新時刻

    谷東智能助力美的洗衣機荊州工廠榮獲世界紀錄認證

    近日,美的洗衣機荊州工廠榮獲總部位于倫敦的世界紀錄認證機構 WRCA 授予的“世界卓越的首個多場景覆蓋的智能體工廠”認證,標志著行業(yè)首個智能體工廠正式落地。這一成就的背后,谷東智能作為美的集團AI+AR眼鏡合作的供應商,憑借其深耕多年頂尖的AI+AR技術,發(fā)揮了不可忽視的
    的頭像 發(fā)表于 09-01 15:03 ?897次閱讀

    廣汽本田雅閣刷新吉尼斯世界紀錄

    近期,在吉尼斯官方認證官的見證下,廣汽本田雅閣憑借加速持久、轉向靈活、車身穩(wěn)重的駕控性能,以29.196秒內(nèi)繞17個移動樁的成績,成功打破此前由某新能源車型創(chuàng)造的30秒繞16個移動樁的紀錄,創(chuàng)造新的全球汽車挑戰(zhàn)“30秒內(nèi)駕車繞移動樁最多”的吉尼斯
    的頭像 發(fā)表于 08-27 10:12 ?879次閱讀

    語音識別芯片選型有哪些技術參數(shù)要注意

    性能參數(shù) 1. 識別準確率 定義:芯片對語音指令的正確識別比例,通常以百分比表示(如 95% 以上)。 影響因素:環(huán)境噪聲、發(fā)音清晰度、方言適配性等。 應用場景:智能家居、車載系統(tǒng)需≥
    的頭像 發(fā)表于 06-23 17:31 ?681次閱讀
    <b class='flag-5'>語音</b><b class='flag-5'>識別</b>芯片選型有哪些技術參數(shù)要注意

    天合光能再度刷新疊層組件功率世界紀錄

    繼6月9日宣布鈣鈦礦/晶體硅30.6%疊層組件效率及829W疊層組件功率雙世界紀錄后,天合光能今日再傳喜訊——疊層組件功率提升至841W,再次打破世界紀錄。短短一周內(nèi)三次刷新世界紀錄
    的頭像 發(fā)表于 06-13 15:58 ?737次閱讀

    普強信息入選2024語音識別技術公司TOP30榜單

    企業(yè)數(shù)字化升級,這一榮譽不僅體現(xiàn)了普強在語音交互、語義理解、多語種識別等核心技術上的領先優(yōu)勢,更是對普強自主研發(fā)的端到端語音識別系統(tǒng)在高噪聲環(huán)境、復雜口音等極端場景下仍能保持95%以上
    的頭像 發(fā)表于 04-18 17:25 ?1008次閱讀

    天合光能鈣鈦礦晶體硅疊層技術再破世界紀錄

    (Fraunhofer ISE, CalLab)第三方獨立認證,最高電池效率達到31.1%,不僅創(chuàng)造了大面積疊層太陽電池效率新的世界紀錄,而且首次在210mm工業(yè)級電池尺寸上實現(xiàn)超過31%的電池效率,第32次創(chuàng)造和刷新世界紀錄,也標志著天合光能在鈣鈦礦晶體硅疊層技術領域
    的頭像 發(fā)表于 04-11 15:50 ?727次閱讀

    浪潮信息:元腦EPAI已接入DeepSeek,大幅提升DeepSeek企業(yè)應用準確率

    結合,深度開發(fā)模型潛力,快速實現(xiàn)本地化部署DeepSeek,構建準確率高、安全穩(wěn)定的專屬智能應用。實測數(shù)據(jù)顯示,DeepSeek在元腦企智EPAI上開發(fā)的企業(yè)應用回答準確率達到95%。 ? 企業(yè)落地
    的頭像 發(fā)表于 02-23 07:32 ?887次閱讀
    浪潮信息:元腦EPAI已接入DeepSeek,大幅提升DeepSeek企業(yè)應用<b class='flag-5'>準確率</b>

    中國“人造太陽”刷新世界紀錄

    近日,位于安徽合肥的全超導托卡馬克核聚變實驗裝置(EAST),被譽為中國的“人造太陽”,成功創(chuàng)造了新的世界紀錄。該裝置首次實現(xiàn)了1億攝氏度下持續(xù)1000秒的“高質(zhì)量燃燒”,這一成就標志著中國在聚變
    的頭像 發(fā)表于 01-21 10:28 ?774次閱讀

    請問AFE4400 SPO2精度和準確率如何?

    請問用TI 的AFE4400 EVM 測量SPO2 的值,有沒有詳細的說明其測量的準確率和精度,抗弱灌注等。謝謝! 比如如下類似: SpO2 測量范圍 0~100% 分辨 1% 精度 70~100%, 2%
    發(fā)表于 01-15 07:02

    天合光能創(chuàng)造高效n型HJT電池組件效率世界紀錄

    ?)認證,最高組件窗口效率達到25.44%,創(chuàng)造了大面積HJT組件窗口效率的世界紀錄,這是天合光能第30次創(chuàng)造和刷新世界紀錄,也是目前正背面接觸結構晶體硅組件的最高紀錄,創(chuàng)造了單結晶體硅太陽電池組件光電轉換效率的
    的頭像 發(fā)表于 01-06 15:02 ?1097次閱讀