智能音箱自2017年以來(lái)的井噴式爆發(fā),讓語(yǔ)音交互成為市場(chǎng)的焦點(diǎn),越來(lái)越多的行業(yè)硬件設(shè)備開(kāi)始智能語(yǔ)音化。語(yǔ)音應(yīng)用場(chǎng)景的爆發(fā),也帶動(dòng)了AI專(zhuān)用語(yǔ)音芯片的加速崛起。2018年年中,國(guó)內(nèi)一眾語(yǔ)音公司幾乎在同一時(shí)間向市場(chǎng)公布了其AI語(yǔ)音芯片的動(dòng)作,正式開(kāi)啟了AI語(yǔ)音芯片元年。
其中,出門(mén)問(wèn)問(wèn)于2018年5月發(fā)布的AI語(yǔ)音芯片模組“問(wèn)芯”是中國(guó)首個(gè)已量產(chǎn)的AI語(yǔ)音芯片模組,由出門(mén)問(wèn)問(wèn)和杭州國(guó)芯合作打造,可為核心應(yīng)用場(chǎng)景提供一站式、集成難度小、調(diào)試周期短、溝通成本低的AI語(yǔ)音交互解決方案,并且實(shí)現(xiàn)成本降低50%以上。由于芯片的長(zhǎng)周期特性,相較于其他還處于規(guī)劃或流片階段的芯片,出門(mén)問(wèn)問(wèn)的問(wèn)芯無(wú)疑占據(jù)了領(lǐng)跑優(yōu)勢(shì),成為AI語(yǔ)音芯片爆發(fā)年的領(lǐng)航者。
問(wèn)芯集成了出門(mén)問(wèn)問(wèn)的麥克風(fēng)陣列信號(hào)處理技術(shù),語(yǔ)音交互SDK與可定制語(yǔ)義技能,其中包括了公司長(zhǎng)期積累的回聲消除、聲源定向、波束成形、語(yǔ)音降噪、語(yǔ)音喚醒、語(yǔ)音識(shí)別、語(yǔ)義理解與語(yǔ)音合成等自有AI語(yǔ)音交互核心技術(shù)。作為中國(guó)AI語(yǔ)音賽道獨(dú)角獸公司,目前出門(mén)問(wèn)問(wèn)可實(shí)現(xiàn)語(yǔ)音喚醒準(zhǔn)確率95%以上,誤喚醒率低于1次/24小時(shí),端到端響應(yīng)速度在業(yè)界領(lǐng)先,提供超過(guò)60個(gè)垂直領(lǐng)域,基本可以覆蓋用戶(hù)衣食住行相關(guān)的語(yǔ)音交互,并且支持用戶(hù)在出門(mén)問(wèn)問(wèn)AI開(kāi)放平臺(tái)進(jìn)行靈活的語(yǔ)義技能自定義。
問(wèn)芯主要包括兩款產(chǎn)品——問(wèn)芯Mobvoi A1和問(wèn)芯Mobvoi B1。其中,Mobvoi A1是一款專(zhuān)門(mén)為語(yǔ)音交互設(shè)計(jì)的前端音頻信號(hào)處理和神經(jīng)網(wǎng)絡(luò)處理芯片,集成了出門(mén)問(wèn)問(wèn)的麥克風(fēng)陣列算法、語(yǔ)音喚醒等,配合后端語(yǔ)音交互SDK,能夠保證遠(yuǎn)場(chǎng)語(yǔ)音交互在噪音環(huán)境下的體驗(yàn),適用于智能電視、智能機(jī)頂盒、智能冰箱、智能鏡子、智能零售終端等產(chǎn)品場(chǎng)景。Mobvoi B1是一款支持完整語(yǔ)音交互應(yīng)用的SoC芯片,除了擁有Mobvoi A1強(qiáng)勁的麥克風(fēng)陣列信號(hào)處理功能外,還集成了語(yǔ)音喚醒、在線/離線語(yǔ)音識(shí)別、在線/離線語(yǔ)義理解、在線內(nèi)容搜索、在線/離線語(yǔ)音合成等出門(mén)問(wèn)問(wèn)提供的全棧式語(yǔ)音交互功能,可廣泛應(yīng)用于智能白電、智能小家電、智能晾衣架、智能沙發(fā)等產(chǎn)品場(chǎng)景中。
具體來(lái)說(shuō),Mobvoi A1集成了麥克風(fēng)陣列、DSP內(nèi)核和NPU內(nèi)核,通過(guò)出門(mén)問(wèn)問(wèn)自主研發(fā)的麥克風(fēng)陣列算法,包括回聲消除、聲源定向、波束成型、降噪等,實(shí)現(xiàn)3-5米內(nèi)強(qiáng)勁的降噪功能。例如在電視、機(jī)頂盒、零售終端等大噪音的使用環(huán)境下,即使是設(shè)備播放聲音時(shí),麥克風(fēng)處音量達(dá)到90dB,回聲抑制也可達(dá)到40dB以上,能在3米距離實(shí)現(xiàn)正常人聲喚醒率85%以上。Mobvoi A1支持線性陣列和環(huán)形陣列的高精度聲源定向,定向精度在±10°以?xún)?nèi),通過(guò)波束成型算法增強(qiáng)目標(biāo)方向語(yǔ)音,抑制±15°波束外噪音超過(guò)14dB以上。而對(duì)于空氣凈化器、空調(diào)等平穩(wěn)噪音的使用環(huán)境下,Mobvoi A1的降噪算法也可以實(shí)現(xiàn)8dB以上的抑制。
此外,Mobvoi A1還可提供友好的用戶(hù)接口。相對(duì)于市面上絕大多數(shù)只提供IIS音頻接口的產(chǎn)品,Mobvoi A1提供了更標(biāo)準(zhǔn)、更常見(jiàn)的USB接口。尤其是對(duì)于本身自帶USB接口的電視、機(jī)頂盒、冰箱、鏡子、新零售終端等產(chǎn)品,Mobvoi A1能做到USB即插即用,并實(shí)現(xiàn)在線的OTA固件升級(jí),極大的減少了溝通調(diào)試成本,降低了客戶(hù)在產(chǎn)品中集成AI語(yǔ)音能力的難度。
Mobvoi A1的使用方式極為靈活,可為不同產(chǎn)品場(chǎng)景的客戶(hù)實(shí)現(xiàn)高度定制化。首先,在麥克風(fēng)陣列形式上,客戶(hù)可通過(guò)配置參數(shù)的方式選擇2麥克風(fēng)、4麥克風(fēng)、6麥克風(fēng),以及線性布局或者環(huán)形布局。其次,針對(duì)零售嘈雜的環(huán)境,客戶(hù)可自由選擇語(yǔ)音或人臉識(shí)別喚醒,并實(shí)現(xiàn)指定方向波束成形降噪。同時(shí),客戶(hù)也可按照需求,設(shè)置指令,針對(duì)某些功能場(chǎng)景暫時(shí)關(guān)閉麥克風(fēng)陣列算法,例如語(yǔ)音通話場(chǎng)景。最后,客戶(hù)可根據(jù)產(chǎn)品場(chǎng)景靈活的選擇USB輸入方式、模擬輸入方式(包括喇叭前端或者后端電路分壓兩種)等回聲消除方案。
而Mobvoi B1和Mobvoi A1一脈相承,在Mobvoi A1強(qiáng)勁的麥克風(fēng)陣列降噪基礎(chǔ)之上,還集成了出門(mén)問(wèn)問(wèn)的語(yǔ)音喚醒、在線/離線語(yǔ)音識(shí)別、在線/離線語(yǔ)義理解、在線內(nèi)容搜索、在線/離線語(yǔ)音合成等全棧式語(yǔ)音交互技術(shù),支持簡(jiǎn)單易用的標(biāo)準(zhǔn)UART接口和藍(lán)牙通信配網(wǎng)方案,在一顆芯片模組中實(shí)現(xiàn)了離在線融合的語(yǔ)音交互功能。這是一顆完整功能的SoC芯片,加上WiFi模塊就可以很容易的實(shí)現(xiàn)一個(gè)高性能低成本的音箱方案,或有類(lèi)似需求的智能家居方案。
離線語(yǔ)音交互功能的實(shí)現(xiàn),對(duì)于智能家居產(chǎn)品來(lái)說(shuō),可讓用戶(hù)不配網(wǎng)就能直接實(shí)現(xiàn)簡(jiǎn)單的離線語(yǔ)音控制,大大降低了使用門(mén)檻,十分便捷。目前,Mobvoi B1允許客戶(hù)自己編輯離線命令詞識(shí)別的語(yǔ)法文件,在家居環(huán)境下識(shí)別準(zhǔn)確率可達(dá)到95%以上。同時(shí),Mobvoi集成的離線語(yǔ)音識(shí)別和語(yǔ)義理解,能夠針對(duì)性實(shí)現(xiàn)識(shí)別和理解優(yōu)化,讓用戶(hù)可不局限于固定命令詞,用最自然的語(yǔ)言進(jìn)行交互,極大地提升用戶(hù)使用體驗(yàn)。
目前,出門(mén)問(wèn)問(wèn)可提供問(wèn)芯對(duì)應(yīng)的芯片模組和評(píng)估板參考設(shè)計(jì),完善的產(chǎn)品手冊(cè)、文檔等。感興趣的客戶(hù)可聯(lián)系出門(mén)問(wèn)問(wèn)(ai-chips@mobvoi.com)進(jìn)行了解。
電子發(fā)燒友App


















































































評(píng)論