chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線(xiàn)課程
  • 觀看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

智能語(yǔ)音的發(fā)展過(guò)程歷史詳細(xì)概述

mK5P_AItists ? 2018-04-22 11:36 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

1952年,貝爾實(shí)驗(yàn)室(Bell Labs)制造一臺(tái)6英尺高自動(dòng)數(shù)字識(shí)別機(jī)“Audrey”,它可以識(shí)別數(shù)字0~9的發(fā)音,且準(zhǔn)確度高達(dá)90%以上。并且它對(duì)熟人的精準(zhǔn)度高,而對(duì)陌生人則偏低。

1956年,普林斯頓大學(xué)RCA實(shí)驗(yàn)室開(kāi)發(fā)了單音節(jié)詞識(shí)別系統(tǒng),能夠識(shí)別特定人的十個(gè)單音節(jié)詞中所包含的不同音節(jié)。

1959年,MIT的林肯實(shí)驗(yàn)室開(kāi)發(fā)了針對(duì)十個(gè)元音的非特定人語(yǔ)音識(shí)別系統(tǒng)。

二十世紀(jì)六十年代初,東京無(wú)線(xiàn)電實(shí)驗(yàn)室、京都大學(xué)和NEC實(shí)驗(yàn)室在語(yǔ)音識(shí)別領(lǐng)域取得了開(kāi)拓性的進(jìn)展,各自先后制作了能夠進(jìn)行語(yǔ)音識(shí)別的專(zhuān)用硬件。

1964年的世界博覽會(huì)上,IBM向世人展示了數(shù)字語(yǔ)音識(shí)別的“shoe box recognizer”。

二十世紀(jì)七十年代,語(yǔ)音識(shí)別的研究取得了突破性的進(jìn)展,研究重心仍然是孤立詞語(yǔ)語(yǔ)音識(shí)別。

1971年,美國(guó)國(guó)防部研究所(Darpa)贊助了五年期限的語(yǔ)音理解研究項(xiàng)目,希望將識(shí)別的單詞量提升到1000以上。參與該項(xiàng)目的公司和學(xué)術(shù)機(jī)構(gòu)包括IBM、卡內(nèi)基梅隆大學(xué)(CMU)、斯坦福研究院。就這樣,Harpy在CMU誕生了。不像之前的識(shí)別器,Harpy可以識(shí)別整句話(huà)。

二十世紀(jì)八十年代,NEC提出了二階動(dòng)態(tài)規(guī)劃算法,Bell實(shí)驗(yàn)室提出了分層構(gòu)造算法,以及幀同步分層構(gòu)造算法等。同時(shí),連接詞和大詞匯量連續(xù)語(yǔ)音的識(shí)別得到了較大發(fā)展,統(tǒng)計(jì)模型逐步取代模板匹配的方法,隱馬爾科夫模型(HMM)成為語(yǔ)音識(shí)別系統(tǒng)的基礎(chǔ)模型。

八十年代中期,IBM創(chuàng)造了一個(gè)語(yǔ)音控制的打字機(jī)—Tangora,能夠處理大約20000單詞。IBM的研究就是基于隱形馬爾科夫鏈模型(hidden Markov model),在信號(hào)處理技術(shù)中加入統(tǒng)計(jì)信息。這種方法使得在給定音素情況下,很有可能預(yù)測(cè)下一個(gè)因素。

1984年,IBM發(fā)布的語(yǔ)音識(shí)別系統(tǒng)在5000個(gè)詞匯量級(jí)上達(dá)到了95%的識(shí)別率。

1985年AT&T貝爾實(shí)驗(yàn)室建造了第一個(gè)智能麥克風(fēng)系統(tǒng),用來(lái)研究大室內(nèi)空間的聲源位置追蹤問(wèn)題。

1987年開(kāi)始,國(guó)家開(kāi)始執(zhí)行963計(jì)劃后,國(guó)家863智能計(jì)算機(jī)主題專(zhuān)家組為語(yǔ)音識(shí)別研究立項(xiàng),每?jī)赡暌淮巍?/p>

1987年12月,李開(kāi)復(fù)開(kāi)發(fā)出世界上第一個(gè)“非特定人連續(xù)語(yǔ)音識(shí)別系統(tǒng)”。

1988年,卡耐基梅隆大學(xué)結(jié)合矢量量化技術(shù)(VQ),用VQ/HMM方法開(kāi)發(fā)了世界上第一個(gè)非特定人大詞匯量連續(xù)語(yǔ)音識(shí)別系統(tǒng)SPHINX,能夠識(shí)別包括997個(gè)詞匯的4200個(gè)連續(xù)語(yǔ)句。

同年,清華大學(xué)和中科院聲學(xué)所在大詞庫(kù)漢語(yǔ)聽(tīng)寫(xiě)機(jī)的研制上取得了突破性進(jìn)展。

1990年,聲龍發(fā)布了第一款消費(fèi)級(jí)語(yǔ)音識(shí)別產(chǎn)品Dragon Dictate,價(jià)格高達(dá)9000美元。

1992年,IBM引入了它的第一個(gè)聽(tīng)寫(xiě)系統(tǒng),稱(chēng)為“IBM Speech Server Series (ISSS)”。

1992年研發(fā)的Sphinx-II在同年美國(guó)國(guó)防部先進(jìn)技術(shù)研究計(jì)劃署(DARPA)資助的語(yǔ)音基準(zhǔn)評(píng)測(cè)中獲得了最高的識(shí)別準(zhǔn)確度,這主要得益于其在高斯混合和馬爾可夫狀態(tài)層次上用栓連參數(shù)平衡了可訓(xùn)練性和高效性。

1995年,Windows 95上首次搭載微軟SAPI,它使應(yīng)用程序開(kāi)發(fā)者能夠在Windows上創(chuàng)建語(yǔ)音程序。

1995年,AT&T研究院的 Dave Ladd, Chris Ramming, Ken Rehor 以及 Curt Tuckey 在頭腦風(fēng)暴關(guān)于互聯(lián)網(wǎng)會(huì)如何改變電話(huà)應(yīng)用的時(shí)候,產(chǎn)生了一些新的想法:為什么不設(shè)計(jì)這樣一個(gè)系統(tǒng)來(lái)運(yùn)行一種可以解析某種語(yǔ)音標(biāo)記語(yǔ)言的語(yǔ)音瀏覽器,用來(lái)把互聯(lián)網(wǎng)的內(nèi)容和服務(wù)提供到千家萬(wàn)戶(hù)的電話(huà)上。于是,AT&T就開(kāi)始“電話(huà)網(wǎng)絡(luò)項(xiàng)目”(Phone Web Project)。之后,Chris繼續(xù)留在AT&T,Ken去了朗訊,Dave和Curt去了摩托羅拉。(1999年初的時(shí)候,他們分別在各自的公司邁出了語(yǔ)音標(biāo)記語(yǔ)言規(guī)范實(shí)質(zhì)性的第一步。因?yàn)樗麄兊拿苡殃P(guān)系,這幾家公司合作成立了一個(gè)VoiceXML論壇組織,IBM也作為一個(gè)創(chuàng)始公司加入了進(jìn)來(lái)。)

1997年IBM ViaVoice首個(gè)語(yǔ)音聽(tīng)寫(xiě)產(chǎn)品問(wèn)世,你只要對(duì)著話(huà)筒喊出要輸入的字符,它就會(huì)自動(dòng)判斷并且?guī)湍爿斎胛淖?。次年又開(kāi)發(fā)出可以識(shí)別上海話(huà)、廣東話(huà)和四川話(huà)等地方口音的語(yǔ)音識(shí)別系統(tǒng)ViaVoice’ 98。

1998年,微軟在北京成立亞洲研究院,將漢語(yǔ)語(yǔ)音識(shí)別納入重點(diǎn)研究方向之一。

2001年,比爾蓋茨在美國(guó)消費(fèi)電子展上展示了一臺(tái)代號(hào)為MiPad的原型機(jī)。Mipad展現(xiàn)了語(yǔ)音多模態(tài)移動(dòng)設(shè)備的愿景。

2002年,中科院自動(dòng)化所及其所屬模式科技公司推出了“天語(yǔ)”中文語(yǔ)音系列產(chǎn)品——Pattek ASR,結(jié)束了該領(lǐng)域一直被國(guó)外公司壟斷的局面。

2002年,美國(guó)國(guó)防部先進(jìn)技術(shù)研究計(jì)劃署(DARPA)首先啟動(dòng)了EARS項(xiàng)目和TIDES 項(xiàng)目; 由于EARS項(xiàng)目過(guò)于敏感,EARS和TIDES兩個(gè)項(xiàng)目合并為“全球自主語(yǔ)言開(kāi)發(fā)”(Global Autonomous Language Exploitation,GALE)。GALE目標(biāo)是應(yīng)用計(jì)算機(jī)軟件技術(shù)對(duì)海量規(guī)模的多語(yǔ)言語(yǔ)音和文本進(jìn)行獲取、轉(zhuǎn)化、分析和翻譯。

2006年,辛頓(Hinton)提出深度置信網(wǎng)絡(luò)(DBN),促使了深度神經(jīng)網(wǎng)絡(luò)(Deep Neural Network,DNN)研究的復(fù)蘇,掀起了深度學(xué)習(xí)的熱潮。

2009年,辛頓以及他的學(xué)生默罕默德(D. Mohamed)將深度神經(jīng)網(wǎng)絡(luò)應(yīng)用于語(yǔ)音的聲學(xué)建模,在小詞匯量連續(xù)語(yǔ)音識(shí)別數(shù)據(jù)庫(kù)TIMIT上獲得成功。

2009年微軟Win7集成語(yǔ)音功能。

2010年Google Vioce Action支持語(yǔ)音操作與搜索。

2011年初,微軟的DNN模型在語(yǔ)音搜索任務(wù)上獲得成功。

同年科大訊飛將DNN 首次成功應(yīng)用到中文語(yǔ)音識(shí)別領(lǐng)域,并通過(guò)語(yǔ)音云平臺(tái)提供給廣大開(kāi)發(fā)者使用。

2011年10月,蘋(píng)果iPhone 4S發(fā)布,個(gè)人手機(jī)助理Siri誕生,人機(jī)交互翻開(kāi)新篇章。

2012年,科大訊飛在語(yǔ)音合成領(lǐng)域首創(chuàng)RBM技術(shù)。

2012年,谷歌的智能語(yǔ)音助手Google Now 的形式出現(xiàn)在眾人面前,用在安卓 4.1 和 Nexus 手機(jī)上。

2013年,Google發(fā)布Google Glass,蘋(píng)果也加大了對(duì)iWatch的研發(fā)投入,穿戴式語(yǔ)音交互設(shè)備成為新熱點(diǎn)。

同年,科大訊飛在語(yǔ)種識(shí)別領(lǐng)域首創(chuàng)BN-ivec技術(shù)。

2014 年,思必馳推出首個(gè)可實(shí)時(shí)轉(zhuǎn)錄的語(yǔ)音輸入板。

2014年11月,亞馬遜智能音箱Echo發(fā)布。

2015 年,思必馳推出首個(gè)可智能打斷糾正的語(yǔ)音技術(shù)。

2016年,Google Assistant伴隨Google Home 正式亮相,搶奪亞馬遜智能音箱市場(chǎng)。(亞馬遜Echo在2016年的智能音箱市場(chǎng)占有率達(dá)到了巔峰的88%)

同年,科大訊飛上線(xiàn)DFCNN(深度全序列卷積神經(jīng)網(wǎng)絡(luò),Deep Fully Convolutional Neural Network)語(yǔ)音識(shí)別系統(tǒng)。

同年11月,科大訊飛、搜狗、百度先后召開(kāi)發(fā)布會(huì),對(duì)外公布語(yǔ)音識(shí)別準(zhǔn)確率均達(dá)到“97%”。

2017年3月,IBM結(jié)合了 LSTM 模型和帶有 3 個(gè)強(qiáng)聲學(xué)模型的 WaveNet 語(yǔ)言模型?!凹袛U(kuò)展深度學(xué)習(xí)應(yīng)用技術(shù)終于取得了 5.5% 詞錯(cuò)率的突破”。相對(duì)應(yīng)的是去年5月的6.9%。

2017年8月,微軟發(fā)布新的里程碑,通過(guò)改進(jìn)微軟語(yǔ)音識(shí)別系統(tǒng)中基于神經(jīng)網(wǎng)絡(luò)的聽(tīng)覺(jué)和語(yǔ)言模型,在去年基礎(chǔ)上降低了大約12%的出錯(cuò)率,詞錯(cuò)率為5.1%,聲稱(chēng)超過(guò)專(zhuān)業(yè)速記員。相對(duì)應(yīng)的是去年10月的5.9%,聲稱(chēng)超過(guò)人類(lèi)。

2017年12月,谷歌發(fā)布全新端到端語(yǔ)音識(shí)別系統(tǒng)(State-of-the-art Speech Recognition With Sequence-to-Sequence Models),詞錯(cuò)率降低至5.6%。相對(duì)于強(qiáng)大的傳統(tǒng)系統(tǒng)有 16% 的性能提升。

市場(chǎng)分析公司Canalys在2018年1月分布一份報(bào)告,其預(yù)測(cè)2018年將是普及智能音箱的“決定性一年”,相比全年出貨量剛過(guò)3000萬(wàn)臺(tái)的2017年,2018年智能音箱全球出貨量預(yù)計(jì)將達(dá)到5630萬(wàn)臺(tái)。

智能語(yǔ)音的發(fā)展過(guò)程歷史詳細(xì)概述

中投顧問(wèn)發(fā)布的《2018-2022年中國(guó)智能語(yǔ)音行業(yè)深度調(diào)研及投資前景預(yù)測(cè)報(bào)告》顯示我國(guó)智能語(yǔ)音市場(chǎng)整體處于啟動(dòng)期,智能車(chē)載,智能家居,智能可穿戴等垂直領(lǐng)域處于爆發(fā)前夜。

智能語(yǔ)音的發(fā)展過(guò)程歷史詳細(xì)概述

聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 智能語(yǔ)音
    +關(guān)注

    關(guān)注

    11

    文章

    827

    瀏覽量

    50308

原文標(biāo)題:智能語(yǔ)音簡(jiǎn)史:這場(chǎng)技術(shù)革命從哪開(kāi)始?

文章出處:【微信號(hào):AItists,微信公眾號(hào):人工智能學(xué)家】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    基于i.MX RT106V跨界MCU的智能語(yǔ)音UI邊緣就緒解決方案

    SLN-SVUI-IOT EdgeReady智能語(yǔ)音UI解決方案.pdf 解決方案概述 NXP的這一解決方案支持本地和在線(xiàn)語(yǔ)音控制,利用集成了
    的頭像 發(fā)表于 12-24 17:15 ?696次閱讀

    ATH8809 智能語(yǔ)音處理芯片

    智能語(yǔ)音
    深圳市聲訊電子有限公司
    發(fā)布于 :2025年12月24日 16:58:05

    WT588F02KD-32N語(yǔ)音芯片:智能電飯煲的語(yǔ)音交互革新方案

    一、智能電飯煲的語(yǔ)音交互新時(shí)代1.1電飯煲產(chǎn)品的智能化轉(zhuǎn)型隨著智能家居技術(shù)的快速發(fā)展,現(xiàn)代電飯煲已從簡(jiǎn)單的"煮飯工具"升級(jí)為集
    的頭像 發(fā)表于 11-20 09:19 ?792次閱讀
    WT588F02KD-32N<b class='flag-5'>語(yǔ)音</b>芯片:<b class='flag-5'>智能</b>電飯煲的<b class='flag-5'>語(yǔ)音</b>交互革新方案

    廣州唯創(chuàng)電子WTK6900H-24SS語(yǔ)音識(shí)別芯片:智能語(yǔ)音控制賦能臺(tái)燈創(chuàng)新應(yīng)用 | 語(yǔ)音IC廠(chǎng)家

    智能家居快速發(fā)展的今天,語(yǔ)音交互技術(shù)正在深刻改變?nèi)藗兣c家居設(shè)備的互動(dòng)方式。臺(tái)燈作為日常生活中不可或缺的照明工具,其智能化升級(jí)已成為行業(yè)發(fā)展
    的頭像 發(fā)表于 11-05 09:20 ?824次閱讀
    廣州唯創(chuàng)電子WTK6900H-24SS<b class='flag-5'>語(yǔ)音</b>識(shí)別芯片:<b class='flag-5'>智能</b><b class='flag-5'>語(yǔ)音</b>控制賦能臺(tái)燈創(chuàng)新應(yīng)用 | <b class='flag-5'>語(yǔ)音</b>IC廠(chǎng)家

    充電樁上液晶顯示應(yīng)用發(fā)展過(guò)程

    隨著新能源汽車(chē)大規(guī)模普及,充電樁的缺口越來(lái)越大,特別是可以實(shí)現(xiàn)快速充電充電樁站越來(lái)越多,對(duì)于顯示的需求也越來(lái)越不一樣,縱觀充電樁顯示的迭代的整個(gè)過(guò)程,剛開(kāi)始,國(guó)內(nèi)的直流樁大部分以國(guó)網(wǎng)為主體發(fā)展
    發(fā)表于 10-09 09:37

    廣州唯創(chuàng)電子WTN6170-8S語(yǔ)音芯片:智能電茶爐的語(yǔ)音交互完美解決方案

    讓泡茶過(guò)程更優(yōu)雅,智能語(yǔ)音提示提升茶藝體驗(yàn)在現(xiàn)代快節(jié)奏生活中,智能電茶爐已經(jīng)成為追求品質(zhì)生活人士的必備器具。傳統(tǒng)的電茶爐操作依賴(lài)指示燈和屏幕顯示,使用
    的頭像 發(fā)表于 09-22 09:55 ?708次閱讀
    廣州唯創(chuàng)電子WTN6170-8S<b class='flag-5'>語(yǔ)音</b>芯片:<b class='flag-5'>智能</b>電茶爐的<b class='flag-5'>語(yǔ)音</b>交互完美解決方案

    語(yǔ)音芯片讓壁掛爐更智能——唯創(chuàng)電子WTVxxx系列聲音IC應(yīng)用解決方案

    隨著智能家居技術(shù)的快速發(fā)展,智能壁掛爐逐漸成為家庭供暖的重要設(shè)備。為了讓用戶(hù)在操作過(guò)程中享受到更加便捷、直觀的交互體驗(yàn),廣州唯創(chuàng)電子WTVxxx系列
    的頭像 發(fā)表于 09-15 09:10 ?580次閱讀
    <b class='flag-5'>語(yǔ)音</b>芯片讓壁掛爐更<b class='flag-5'>智能</b>——唯創(chuàng)電子WTVxxx系列聲音IC應(yīng)用解決方案

    推進(jìn)一款實(shí)用型的OTP語(yǔ)音芯片

    YCV系列語(yǔ)音芯片:讓智能快遞柜取件更便利 隨著互聯(lián)網(wǎng)的普及與電子商務(wù)的快速發(fā)展,網(wǎng)購(gòu)已成為越來(lái)越多人日常生活的一部分,催生出一個(gè)龐大的“網(wǎng)購(gòu)群體”??爝f服務(wù)因此廣泛覆蓋,將各類(lèi)商品送達(dá)消費(fèi)者手中
    發(fā)表于 08-26 11:32

    智能語(yǔ)音交互升級(jí),九芯語(yǔ)音識(shí)別芯片來(lái)助力

    在科技飛速發(fā)展的當(dāng)下,智能語(yǔ)音交互已經(jīng)深度融入我們的生活,從智能家居的便捷操控,到車(chē)載電子的安全駕駛輔助,再到智能玩具的趣味互動(dòng),
    的頭像 發(fā)表于 08-11 14:08 ?1032次閱讀
    <b class='flag-5'>智能</b><b class='flag-5'>語(yǔ)音</b>交互升級(jí),九芯<b class='flag-5'>語(yǔ)音</b>識(shí)別芯片來(lái)助力

    茶吧機(jī)語(yǔ)音控制方案設(shè)計(jì)2025新版

    一、方案概述智能家居技術(shù)飛速發(fā)展的當(dāng)下,茶吧機(jī)的智能化升級(jí)成為必然趨勢(shì)。語(yǔ)音控制作為一種便捷、自然的交互方式,正逐漸成為茶吧機(jī)
    的頭像 發(fā)表于 07-22 17:02 ?1160次閱讀
    茶吧機(jī)<b class='flag-5'>語(yǔ)音</b>控制方案設(shè)計(jì)2025新版

    智能語(yǔ)音交互別再瞎選語(yǔ)音芯片了!NRK3502 才是你的最優(yōu)解!

    在科技飛速發(fā)展的當(dāng)下,智能產(chǎn)品如潮水般涌入我們的生活,從智能家居到智能醫(yī)療,從智能玩具到工業(yè)控制,語(yǔ)音
    的頭像 發(fā)表于 07-10 07:03 ?680次閱讀
    <b class='flag-5'>智能</b><b class='flag-5'>語(yǔ)音</b>交互別再瞎選<b class='flag-5'>語(yǔ)音</b>芯片了!NRK3502 才是你的最優(yōu)解!

    藍(lán)牙語(yǔ)音遙控器:智能家居的智慧控制核心

    隨著智能家居的蓬勃發(fā)展,藍(lán)牙語(yǔ)音遙控器憑借其便捷的操作和智能交互體驗(yàn),正迅速取代傳統(tǒng)紅外遙控器,成為智能電視、機(jī)頂盒等設(shè)備的首選控制工具。
    發(fā)表于 06-01 20:24

    明遠(yuǎn)智睿SSD2351開(kāi)發(fā)板:語(yǔ)音機(jī)器人領(lǐng)域的變革力量

    在人工智能快速發(fā)展的今天,語(yǔ)音機(jī)器人逐漸成為人們生活和工作中的得力助手。明遠(yuǎn)智睿SSD2351開(kāi)發(fā)板憑借強(qiáng)大性能與豐富功能,為語(yǔ)音機(jī)器人的發(fā)展
    發(fā)表于 05-28 11:36

    藍(lán)牙語(yǔ)音遙控器 低功耗芯片選型HS6621CxC/OM6621

    隨著智能家居的蓬勃發(fā)展,藍(lán)牙語(yǔ)音遙控器憑借其便捷的操作和智能交互體驗(yàn),正迅速取代傳統(tǒng)紅外遙控器,成為智能電視、機(jī)頂盒等設(shè)備的首選控制工具。相
    發(fā)表于 05-22 15:23

    詳細(xì)介紹機(jī)場(chǎng)智能指路機(jī)器人的工作原理

    機(jī)場(chǎng)智能指路機(jī)器人主要依靠感知系統(tǒng)、定位系統(tǒng)、導(dǎo)航系統(tǒng)、智能交互系統(tǒng)和運(yùn)動(dòng)系統(tǒng)協(xié)同工作,來(lái)實(shí)現(xiàn)為旅客準(zhǔn)確指路和提供服務(wù)的功能,以下是其詳細(xì)工作原理: 感知系統(tǒng) 傳感器類(lèi)型 :機(jī)器人配備了多種傳感器
    發(fā)表于 05-10 18:26