語(yǔ)音識(shí)別簡(jiǎn)介
與機(jī)器進(jìn)行語(yǔ)音交流,讓機(jī)器明白你說(shuō)什么,這是人們長(zhǎng)期以來(lái)夢(mèng)寐以求的事情。中國(guó)物聯(lián)網(wǎng)校企聯(lián)盟形象得把語(yǔ)音識(shí)別比做為“機(jī)器的聽(tīng)覺(jué)系統(tǒng)”。語(yǔ)音識(shí)別技術(shù)就是讓機(jī)器通過(guò)識(shí)別和理解過(guò)程把語(yǔ)音信號(hào)轉(zhuǎn)變?yōu)橄鄳?yīng)的文本或命令的高技術(shù)。語(yǔ)音識(shí)別技術(shù)主要包括特征提取技術(shù)、模式匹配準(zhǔn)則及模型訓(xùn)練技術(shù)三個(gè)方面。語(yǔ)音識(shí)別技術(shù)車(chē)聯(lián)網(wǎng)也得到了充分的引用,例如在翼卡車(chē)聯(lián)網(wǎng)中,只需按一鍵通客服人員口述即可設(shè)置目的地直接導(dǎo)航,安全、便捷。
語(yǔ)音識(shí)別是一門(mén)交叉學(xué)科。近二十年來(lái),語(yǔ)音識(shí)別技術(shù)取得顯著進(jìn)步,開(kāi)始從實(shí)驗(yàn)室走向市場(chǎng)。人們預(yù)計(jì),未來(lái)10年內(nèi),語(yǔ)音識(shí)別技術(shù)將進(jìn)入工業(yè)、家電、通信、汽車(chē)電子、醫(yī)療、家庭服務(wù)、消費(fèi)電子產(chǎn)品等各個(gè)領(lǐng)域。 語(yǔ)音識(shí)別聽(tīng)寫(xiě)機(jī)在一些領(lǐng)域的應(yīng)用被美國(guó)新聞界評(píng)為1997年計(jì)算機(jī)發(fā)展十件大事之一。很多專(zhuān)家都認(rèn)為語(yǔ)音識(shí)別技術(shù)是2000年至2010年間信息技術(shù)領(lǐng)域十大重要的科技發(fā)展技術(shù)之一。 語(yǔ)音識(shí)別技術(shù)所涉及的領(lǐng)域包括:信號(hào)處理、模式識(shí)別、概率論和信息論、發(fā)聲機(jī)理和聽(tīng)覺(jué)機(jī)理、人工智能等等。
語(yǔ)音分類(lèi)應(yīng)用
根據(jù)識(shí)別的對(duì)象不同,語(yǔ)音識(shí)別任務(wù)大體可分為3類(lèi),即孤立詞識(shí)別(isolated word recognition),關(guān)鍵詞識(shí)別(或稱(chēng)關(guān)鍵詞檢出,keyword spotting)和連續(xù)語(yǔ)音識(shí)別。其中,孤立詞識(shí)別 的任務(wù)是識(shí)別事先已知的孤立的詞,如“開(kāi)機(jī)”、“關(guān)機(jī)”等;連續(xù)語(yǔ)音識(shí)別的任務(wù)則是識(shí)別任意的連續(xù)語(yǔ)音,如一個(gè)句子或一段話;連續(xù)語(yǔ)音流中的關(guān)鍵詞檢測(cè)針對(duì)的是連續(xù)語(yǔ)音,但它并不識(shí)別全部文字,而只是檢測(cè)已知的若干關(guān)鍵詞在何處出現(xiàn),如在一段話中檢測(cè)“計(jì)算機(jī)”、“世界”這兩個(gè)詞。
根據(jù)針對(duì)的發(fā)音人,可以把語(yǔ)音識(shí)別技術(shù)分為特定人語(yǔ)音識(shí)別和非特定人語(yǔ)音識(shí)別,前者只能識(shí)別一個(gè)或幾個(gè)人的語(yǔ)音,而后者則可以被任何人使用。顯然,非特定人語(yǔ)音識(shí)別系統(tǒng)更符合實(shí)際需要,但它要比針對(duì)特定人的識(shí)別困難得多。
另外,根據(jù)語(yǔ)音設(shè)備和通道,可以分為桌面(PC)語(yǔ)音識(shí)別、電話語(yǔ)音識(shí)別和嵌入式設(shè)備(手機(jī)、PDA等)語(yǔ)音識(shí)別。不同的采集通道會(huì)使人的發(fā)音的聲學(xué)特性發(fā)生變形,因此需要構(gòu)造各自的識(shí)別系統(tǒng)。
語(yǔ)音識(shí)別的應(yīng)用領(lǐng)域非常廣泛,常見(jiàn)的應(yīng)用系統(tǒng)有:語(yǔ)音輸入系統(tǒng),相對(duì)于鍵盤(pán)輸入方法,它更符合人的日常習(xí)慣,也更自然、更高效;語(yǔ)音控制系統(tǒng),即用語(yǔ)音來(lái)控制設(shè)備的運(yùn)行,相對(duì)于手動(dòng)控制來(lái)說(shuō)更加快捷、方便,可以用在諸如工業(yè)控制、語(yǔ)音撥號(hào)系統(tǒng)、智能家電、聲控智能玩具等許多領(lǐng)域;智能對(duì)話查詢(xún)系統(tǒng),根據(jù)客戶(hù)的語(yǔ)音進(jìn)行操作,為用戶(hù)提供自然、友好的數(shù)據(jù)庫(kù)檢索服務(wù),例如家庭服務(wù)、賓館服務(wù)、旅行社服務(wù)系統(tǒng)、訂票系統(tǒng)、醫(yī)療服務(wù)、銀行服務(wù)、股票查詢(xún)服務(wù)等等。
語(yǔ)音識(shí)別原理
系統(tǒng)本質(zhì)上是一種模式識(shí)別系統(tǒng),包括特征提取、模式匹配、參考模式庫(kù)等三個(gè)基本單元,它的基本結(jié)構(gòu)如下圖所示:
未知語(yǔ)音經(jīng)過(guò)話筒變換成電信號(hào)后加在識(shí)別系統(tǒng)的輸入端,首先經(jīng)過(guò)預(yù)處理,再根據(jù)人的語(yǔ)音特點(diǎn)建立語(yǔ)音模型,對(duì)輸入的語(yǔ)音信號(hào)進(jìn)行分析,并抽取所需的特征,在此基礎(chǔ)上建立語(yǔ)音識(shí)別所需的模板。而計(jì)算機(jī)在識(shí)別過(guò)程中要根據(jù)語(yǔ)音識(shí)別的模型,將計(jì)算機(jī)中存放的語(yǔ)音模板與輸入的語(yǔ)音信號(hào)的特征進(jìn)行比較,根據(jù)一定的搜索和匹配策略,找出一系列最優(yōu)的與輸入語(yǔ)音匹配的模板。然后根據(jù)此模板的定義,通過(guò)查表就可以給出計(jì)算機(jī)的識(shí)別結(jié)果。顯然,這種最優(yōu)的結(jié)果與特征的選擇、語(yǔ)音模型的好壞、模板是否準(zhǔn)確都有直接的關(guān)系。
國(guó)內(nèi)語(yǔ)音識(shí)別公司有哪些
科大訊飛股份有限公司
科大訊飛股份有限公司成立于1999年,是一家專(zhuān)業(yè)從事智能語(yǔ)音及語(yǔ)言技術(shù)、人工智能技術(shù)研究,軟件及芯片產(chǎn)品開(kāi)發(fā),語(yǔ)音信息服務(wù)及電子政務(wù)系統(tǒng)集成的國(guó)家級(jí)骨干軟件企業(yè)。2008年,科大訊飛在深圳證券交易所掛牌上市,股票代碼:002230。
科大訊飛在智能語(yǔ)音核心技術(shù)研究領(lǐng)域,一直秉承“從市場(chǎng)中來(lái)、到市場(chǎng)中去”,“用正確的方法、做有用的研究”等核心理念,致力于建立智能語(yǔ)音及語(yǔ)言核心技術(shù)和核心技術(shù)應(yīng)用產(chǎn)業(yè)化兩大方面的競(jìng)爭(zhēng)力??拼笥嶏w的核心技術(shù)主要包括:語(yǔ)音識(shí)別技術(shù)、語(yǔ)音合成技術(shù)、自然語(yǔ)言理解技術(shù)、語(yǔ)音評(píng)測(cè)技術(shù)、聲紋語(yǔ)種技術(shù)、手寫(xiě)識(shí)別技術(shù)等??拼笥嶏w始終堅(jiān)持提供國(guó)際領(lǐng)先的語(yǔ)音及語(yǔ)言整體解決方案,不斷推出符合國(guó)家和社會(huì)需求的智能語(yǔ)音及語(yǔ)言技術(shù)產(chǎn)品及應(yīng)用服務(wù)。
匯頂科技
匯頂科技成立于2002年,作為全球人機(jī)交互及生物識(shí)別技術(shù)領(lǐng)導(dǎo)者,目前已在包括手機(jī)、平板電腦和可穿戴產(chǎn)品等在內(nèi)的智能移動(dòng)終端領(lǐng)域構(gòu)筑了領(lǐng)先優(yōu)勢(shì),先后推出全球領(lǐng)先的單層多點(diǎn)觸控芯片、全球首創(chuàng)的觸摸屏近場(chǎng)通信技術(shù)Goodix LinkTM、全球首家應(yīng)用于Android手機(jī)正面的按壓式指紋識(shí)別芯片、全球首創(chuàng)的Invisible Fingerprint Sensor(IFSTM)、全球首創(chuàng)支持玻璃蓋板的指紋識(shí)別芯片、全球首創(chuàng)應(yīng)用于移動(dòng)終端的活體指紋檢測(cè)技術(shù)Live Finger DetectionTM、全球首創(chuàng)的顯示屏內(nèi)指紋識(shí)別技術(shù)等。
其中,Live Finger DetectionTM憑借其卓越的創(chuàng)新應(yīng)用價(jià)值斬獲了2017國(guó)際消費(fèi)電子展(CES)全球創(chuàng)新金獎(jiǎng),這是匯頂科技繼2016年憑借IFSTM(觸控與指紋識(shí)別一體化技術(shù))和Goodix LinkTM(觸摸屏近場(chǎng)通信技術(shù))兩項(xiàng)技術(shù)獲得CES創(chuàng)新大獎(jiǎng)后再次得到CES創(chuàng)新獎(jiǎng)項(xiàng),匯頂科技也由此成為首家榮獲CES全球創(chuàng)新金獎(jiǎng)的中國(guó)IC設(shè)計(jì)公司。目前,產(chǎn)品和解決方案主要應(yīng)用于華為、OPPO、vivo、小米、中興、魅族、聯(lián)想、金立、錘子、TCL、Nokia、Dell、HP、LG、ASUS、acer、 TOSHIBA、Panasonic等國(guó)際國(guó)內(nèi)知名品牌,服務(wù)全球數(shù)億人群。
漢王科技股份有限公司
漢王科技股份有限公司成立于1998年,是全球文字識(shí)別技術(shù)與智能交互產(chǎn)品引領(lǐng)者,多年來(lái),通過(guò)不斷自主創(chuàng)新,在手寫(xiě)識(shí)別、光學(xué)字符識(shí)別(OCR)、筆跡輸入等領(lǐng)域擁有多項(xiàng)具有自主知識(shí)產(chǎn)權(quán)的核心技術(shù),綜合技術(shù)水平在國(guó)內(nèi)外均處于領(lǐng)先地位,手寫(xiě)漢字識(shí)別獲得國(guó)家科技進(jìn)步一等獎(jiǎng),OCR獲得國(guó)家科技進(jìn)步二等獎(jiǎng)。
漢王科技以核心技術(shù)為基礎(chǔ),面向市場(chǎng)需求,已形成了以識(shí)別技術(shù)為核心的、針對(duì)不同細(xì)分市場(chǎng)的軟硬件產(chǎn)品系列,既有通用產(chǎn)品,如e典筆、漢王電紙書(shū)、漢王筆、文本王、名片通、繪圖板等,也有針對(duì)教育、金融等行業(yè)應(yīng)用的文表識(shí)別解決方案;既有手寫(xiě)手機(jī)、OCR等多種技術(shù)授權(quán)方案,也有輔助方案實(shí)施的硬件產(chǎn)品,如證照識(shí)別等。
山東共達(dá)電聲股份有限公司
山東共達(dá)電聲股份有限公司是專(zhuān)業(yè)的電聲元器件及電聲組件制造商、服務(wù)商和電聲技術(shù)整體解決方案提供商,是國(guó)家級(jí)高新技術(shù)企業(yè)、中國(guó)電子元件百?gòu)?qiáng)企業(yè)。
公司始創(chuàng)于2001年,自設(shè)立以來(lái),堅(jiān)持“共融、共創(chuàng)、共享、共達(dá)”的企業(yè)核心價(jià)值觀,秉承“和諧、超越、高效、求是”的企業(yè)精神,專(zhuān)注于電聲元器件產(chǎn)品的研發(fā)和制造,致力于成為世界一流的電聲技術(shù)整體解決方案提供商,主要產(chǎn)品包括微型麥克風(fēng)、微型揚(yáng)聲器/受話器及其陣列模組,廣泛應(yīng)用于移動(dòng)通訊設(shè)備及其周邊產(chǎn)品、筆記本電腦、平板電視、個(gè)人數(shù)碼產(chǎn)品、汽車(chē)電子等消費(fèi)類(lèi)電子產(chǎn)品領(lǐng)域。
拓爾思
拓爾思是一家技術(shù)驅(qū)動(dòng)型企業(yè),歷經(jīng)二十余年的深耕和積累,在中文檢索、自然語(yǔ)言處理等領(lǐng)域始終處于行業(yè)前沿,公司2011年在深交所創(chuàng)業(yè)板上市,股票代碼300229,是第一家在A股上市的大數(shù)據(jù)技術(shù)企業(yè)。拓爾思以大數(shù)據(jù)+人工智能為發(fā)展戰(zhàn)略,旨在幫助客戶(hù)實(shí)現(xiàn)從數(shù)據(jù)洞察到智慧決策的飛躍。
拓爾思的核心業(yè)務(wù)包括軟件產(chǎn)品研發(fā),行業(yè)應(yīng)用解決方案和數(shù)據(jù)分析挖掘云服務(wù)三大板塊,涉及大數(shù)據(jù)管理、信息安全、互聯(lián)網(wǎng)營(yíng)銷(xiāo)和人工智能等應(yīng)用方向。
拓爾思是自主可靠軟件產(chǎn)品領(lǐng)域的領(lǐng)軍企業(yè),TRS中文全文檢索系統(tǒng)、WCM內(nèi)容管理平臺(tái)、CKM中文文本挖掘等軟件均代表了國(guó)內(nèi)相關(guān)領(lǐng)域自主創(chuàng)新的最高水平。同時(shí)拓爾思不斷拓寬產(chǎn)品線和綜合服務(wù)能力,為政府、媒體、安全、金融等多個(gè)行業(yè)提供領(lǐng)先的產(chǎn)品、技術(shù)和解決方案。為了迎接云計(jì)算時(shí)代的來(lái)臨,公司近年來(lái)加快了基于云服務(wù)的數(shù)據(jù)分析和知識(shí)服務(wù)的發(fā)展步伐,旨在實(shí)現(xiàn)軟件企業(yè)的戰(zhàn)略轉(zhuǎn)型和升級(jí)。
精倫電子股份有限公司
精倫電子股份有限公司是“武漢·中國(guó)光谷”國(guó)家級(jí)高新技術(shù)企業(yè),成立于1994年,于2002年上市,是中國(guó)首家以全自然人作為發(fā)起人的上市公司,注冊(cè)資本24,604.46萬(wàn)元,股票代碼:600355?,F(xiàn)有精倫工業(yè)園位于武漢總部,占地310畝。
精倫電子致力于各類(lèi)電子智能終端的研發(fā)、設(shè)計(jì)與生產(chǎn)。目前公司主營(yíng)產(chǎn)品包括:電子廣告媒體終端;電子伺服系統(tǒng)終端;二代身份證閱讀終端;電子交易終端;電力終端;家庭媒體娛樂(lè)終端;導(dǎo)航定位終端等。涵蓋了:通訊、電力、傳媒、三網(wǎng)融合、工業(yè)縫紉制造、公共安全等多個(gè)領(lǐng)域。并提供各類(lèi)產(chǎn)品的服務(wù)平臺(tái)、系統(tǒng)及整體設(shè)計(jì)、運(yùn)營(yíng)方案。
精倫電子一直秉承自主知識(shí)產(chǎn)權(quán)和核心技術(shù)為基礎(chǔ)的理念,每年投入銷(xiāo)售利潤(rùn)的較大部分作為研發(fā)投入,與華中科技大學(xué)、上海浦東等地建立合作研發(fā)基地。擁有國(guó)家人事部批準(zhǔn)的博士后科研工作站,在嵌入式操作系統(tǒng)、嵌入式硬件設(shè)計(jì)、嵌入式軟件設(shè)計(jì)、音頻視頻信號(hào)處理、智能卡應(yīng)用技術(shù)、大型數(shù)據(jù)庫(kù)應(yīng)用設(shè)計(jì)、網(wǎng)絡(luò)信息安全設(shè)計(jì)技術(shù)等方面形成了自主核心技術(shù)體系。承建了多項(xiàng)國(guó)家高技術(shù)實(shí)施項(xiàng)目。公司正在逐步成為業(yè)界領(lǐng)先的智能終端研發(fā)與設(shè)計(jì)基地。
上海益深電子有限公司
上海益深電子有限公司,為專(zhuān)業(yè)從事語(yǔ)音芯片和家電控制芯片開(kāi)發(fā)、生產(chǎn)、銷(xiāo)售的高科技企業(yè)。主營(yíng)單片機(jī)和DSP芯片以及相關(guān)電子產(chǎn)品和模組,承接各種專(zhuān)業(yè)控制方案開(kāi)發(fā)。公司秉承“顧客至上,銳意進(jìn)取”的經(jīng)營(yíng)理念,堅(jiān)持的原則,為廣大客戶(hù)提供最優(yōu)質(zhì)的服務(wù)。業(yè)務(wù)范圍:涉及汽車(chē)電子、多媒體、安全防盜、通信器材、家電控制、醫(yī)療器械、工業(yè)自動(dòng)化控制、益智玩具及互動(dòng)消費(fèi)類(lèi)產(chǎn)品等領(lǐng)域。
南京子佩軟件科技有限公司
南京子佩軟件科技有限公司是是從事通訊類(lèi)產(chǎn)品研發(fā)、生產(chǎn)、銷(xiāo)售及提供相關(guān)通訊運(yùn)營(yíng)服務(wù)的高科技企業(yè),公司擁有一批經(jīng)驗(yàn)豐富、技術(shù)過(guò)硬,致力于語(yǔ)音通訊和數(shù)據(jù)通訊產(chǎn)品開(kāi)發(fā)與應(yīng)用的技術(shù)隊(duì)伍,公司是目前國(guó)內(nèi)最有影響的電話語(yǔ)音卡/電話語(yǔ)音盒/電話錄音盒系列話務(wù)信息產(chǎn)品提供商之一,公司采用ISO9001質(zhì)量保證體系和當(dāng)前全球先進(jìn)的語(yǔ)音通訊前沿技術(shù),致力于為中國(guó)及全球企業(yè)提供高品質(zhì)系列話務(wù)信息產(chǎn)品。
廣州科靈電子有限公司
廣州科靈電子有限公司是智能一卡通設(shè)備制造企業(yè),主營(yíng):停車(chē)場(chǎng)收費(fèi)管理系統(tǒng)、停車(chē)場(chǎng)設(shè)備、高清車(chē)牌識(shí)別一體機(jī)、遠(yuǎn)距離藍(lán)牙系統(tǒng)、道閘/擋車(chē)器、人行通道閘(三輥閘、擺閘、翼閘)、電子巡更系統(tǒng)、車(chē)位/區(qū)位引導(dǎo)系統(tǒng)、電動(dòng)伸縮門(mén)、崗?fù)?、門(mén)禁考勤系統(tǒng)、梯控管理系統(tǒng)、交通輔助設(shè)施等系列產(chǎn)品,公司擁有完整、科學(xué)的質(zhì)量管理體系。
深圳伊蘭度科技有限公司
是專(zhuān)業(yè)從事停車(chē)場(chǎng)門(mén)禁設(shè)備研發(fā),生產(chǎn)為一體的高科技公司。公司研發(fā)中心分為硬件、軟件、機(jī)電三個(gè)研發(fā)部門(mén),座落于深圳硅谷動(dòng)力產(chǎn)業(yè)園內(nèi),主要從事停車(chē)場(chǎng)一卡通軟件硬件產(chǎn)品的研發(fā)設(shè)計(jì),并為客戶(hù)提供軟件,硬件個(gè)性化的定制服務(wù)。 產(chǎn)品有:道閘機(jī)、停車(chē)場(chǎng)系統(tǒng)、藍(lán)牙遠(yuǎn)距離、車(chē)牌自動(dòng)識(shí)別系統(tǒng)、地感控制器、票箱、售飯機(jī)、售飯系統(tǒng)、消費(fèi)機(jī)、食堂售飯機(jī)、食堂刷卡機(jī)、巡更機(jī)、巡更棒、巡更器、巡更系統(tǒng)、巡檢器等產(chǎn)品。
評(píng)論