chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

三星無聲語音助手專利解密:可以完成精準(zhǔn)語音識別任務(wù)

ss ? 來源:愛集微APP ? 作者:愛集微APP ? 2021-02-12 15:03 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

【嘉德點(diǎn)評】三星發(fā)明的可以完成精準(zhǔn)語音識別任務(wù)的語音識別助手,在交互時(shí)無需發(fā)出語音,僅通過用戶少量選擇操作就可以完成復(fù)雜的交互任務(wù),因此,可以簡便且準(zhǔn)確地采用語音識別方式來實(shí)現(xiàn)交互任務(wù)。

集微網(wǎng)消息,在2019年,三星就曾預(yù)告過新的“人造人”NEON助手,并表示NEON可以像真正的人類一樣進(jìn)行對話,并有一定的感知能力。NEON的網(wǎng)站上宣傳其外觀和行為都像真實(shí)的人類,能夠表現(xiàn)出情感和智慧,而據(jù)相關(guān)消息,三星最終將隨三星Galaxy S21 Ultra獨(dú)家發(fā)售這款數(shù)字助手。

數(shù)字助手首先也是一款手機(jī)助手軟件,目前,智能手機(jī)能夠提供各種類型的應(yīng)用服務(wù),其中就包括手機(jī)助手軟件,用戶可以通過語音、文字等方式與智能手機(jī)之間進(jìn)行交互,智能手機(jī)通過該語音識別助手軟件識別語音后,提供對應(yīng)的應(yīng)用服務(wù)。

智能手機(jī)識別語音的功能可以有三種方式:交互任務(wù)型、知識問答型及閑聊型。其中,交互任務(wù)型語音識別方式使得用戶可以通過直接的語音輸入,由智能手機(jī)識別該語音,完成與智能手機(jī)的應(yīng)用服務(wù)之間的交互意圖,而無需進(jìn)行多次語音識別界面的操作。

但是,智能手機(jī)提供的交互任務(wù)型語音識別方式對用戶來說,使用率并不高,這是因?yàn)橛脩粼谕ㄟ^語音操控智能手機(jī)時(shí),存在以下缺點(diǎn):1)公眾場合不適合使用語音,有隱私問題;2) 智能手機(jī)處于嘈雜的遠(yuǎn)程環(huán)境下,語音識別的效果不佳;3)因?yàn)橛脩舭l(fā)音不準(zhǔn)確,形同意思的表述方式多樣等因素,語音識別和語音理解的準(zhǔn)確率還需要提高;4)有些用戶不習(xí)慣使用智能手機(jī)提供的語音識別界面。

那么,智能手機(jī)該如何在這些條件下簡便且準(zhǔn)確地采用語音識別方式實(shí)現(xiàn)交互任務(wù)呢?為此,三星在2019年9月27日申請了一項(xiàng)名為“一種采用語音識別方式實(shí)現(xiàn)交互任務(wù)的方法及系統(tǒng)”的發(fā)明專利(申請?zhí)枺?01910921533.6),申請人為三星電子(中國)研發(fā)中心和三星電子株式會社。

根據(jù)該專利目前公開的資料,讓我們一起來看看這項(xiàng)應(yīng)用于智能設(shè)備的語音識別方法及系統(tǒng)吧。

如上圖,為該專利中發(fā)明的采用語音識別方式實(shí)現(xiàn)交互任務(wù)的方法流程示意圖,首先,系統(tǒng)會基于當(dāng)前環(huán)境進(jìn)行語音識別來得到文本以及語義信息,基于得到的文本以及語義信息,來確定對應(yīng)的上下文信息,且劃分不同的場景,基于不同的場景來在系統(tǒng)中匹配不同的語音技能推薦表。

這種利用語音技能推薦表的方式,可以更加準(zhǔn)確的應(yīng)對不同的場景,通過事先準(zhǔn)備好豐富的語料庫,就可以非常人性化的與用戶進(jìn)行對話以及完成相應(yīng)的操作。而當(dāng)要實(shí)現(xiàn)交互任務(wù)時(shí),則會根據(jù)語音技能推薦表執(zhí)行智能手機(jī)的交互任務(wù)。同時(shí),由于是智能助手主動(dòng)分析用戶所處場景,并主動(dòng)提供相關(guān)的操作服務(wù),因此無需用戶主動(dòng)發(fā)起語音喚醒,而是由語音助手主動(dòng)為用戶提供相關(guān)服務(wù),只需用戶進(jìn)行選擇即可。

如上圖,為這種采用語音識別方式實(shí)現(xiàn)交互任務(wù)的方法子流程圖,當(dāng)用戶喚醒語音助手插件模塊時(shí),語音助手插件模塊被觸發(fā),該模塊通知語言輸入信息采集模塊啟動(dòng)信息采集,信息采集模塊通過上下文感知模塊獲取到當(dāng)前的環(huán)境信息,再向語音助手插件模塊發(fā)送請求,來獲取從用戶語音識別得到的文本,以及做自然語言理解后的語義信息。

之后,語言輸入信息采集模塊將采集到的文本、語義信息及當(dāng)前的環(huán)境信息傳輸給語言技能生成模塊,由此來生成語言技能庫,并通知語言技能推薦模塊。

語言技能推薦模塊在特定情況下可以啟動(dòng),將大量不同的上下文劃分到若干類場景中,對每個(gè)場景生成相應(yīng)的語言技能推薦表。

如上圖,為在手機(jī)上使用語言技能推薦表的展示圖,該款語音助手插件模塊為Bixby,當(dāng)每次都調(diào)用Bixby時(shí),都會顯示出語言技能推薦表,并且場景不同,該語言技能推薦表中的推薦技能偶讀不同。

例如,經(jīng)過學(xué)習(xí)后,如果用戶打開手機(jī)并且喚醒了Bixby,則就可以觸發(fā)語言技能推薦表的展示,當(dāng)用戶選擇某條推薦的語言技能時(shí),將該語言技能推薦表中的文本用作用戶語言輸入識別的結(jié)果,以完成后續(xù)用戶的指令。

以上就是三星發(fā)明的可以完成精準(zhǔn)語音識別任務(wù)的靜默式語音識別助手,其在實(shí)現(xiàn)交互任務(wù)時(shí),基于當(dāng)前環(huán)境下對語音識別得到文本以及語音信息,在交互時(shí)無需發(fā)出語音,僅通過用戶少量選擇操作就可以完成復(fù)雜的交互任務(wù),因此可以簡便且準(zhǔn)確地采用語音識別方式來實(shí)現(xiàn)交互任務(wù)。

責(zé)任編輯:xj

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報(bào)投訴
  • 三星電子
    +關(guān)注

    關(guān)注

    34

    文章

    15891

    瀏覽量

    182706
  • 語音助手
    +關(guān)注

    關(guān)注

    7

    文章

    241

    瀏覽量

    27468
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點(diǎn)推薦

    基于開源鴻蒙的語音識別語音合成應(yīng)用開發(fā)樣例

    本期內(nèi)容由AI Model SIG提供,介紹了在開源鴻蒙中,利用sherpa_onnx開源方庫進(jìn)行ASR語音識別與TTS語音合成應(yīng)用開發(fā)的流程。
    的頭像 發(fā)表于 08-25 14:26 ?3091次閱讀
    基于開源鴻蒙的<b class='flag-5'>語音</b><b class='flag-5'>識別</b>及<b class='flag-5'>語音</b>合成應(yīng)用開發(fā)樣例

    語音識別---大家怎么看呢?

    語音識別是一門交叉學(xué)科。近二十年來,語音識別技術(shù)取得顯著進(jìn)步,開始從實(shí)驗(yàn)室走向市場。人們預(yù)計(jì),未來10年內(nèi),語音
    發(fā)表于 08-09 10:54

    EASY EAl Orin Nano(RK3576) whisper語音識別訓(xùn)練部署教程

    英語語音識別上達(dá)到接近人類水平的魯棒性和準(zhǔn)確性。Whisper還可以進(jìn)行多語言語音識別語音翻譯
    的頭像 發(fā)表于 07-25 15:21 ?388次閱讀
    EASY EAl Orin Nano(RK3576) whisper<b class='flag-5'>語音</b><b class='flag-5'>識別</b>訓(xùn)練部署教程

    EASY EAl Orin Nano(RK3576) whisper語音識別訓(xùn)練部署教程

    Whisper是OpenAI開源的,識別語音識別能力已達(dá)到人類水準(zhǔn)自動(dòng)語音識別系統(tǒng)。Whisper作為一個(gè)通用的
    的頭像 發(fā)表于 07-17 14:55 ?1279次閱讀
    EASY EAl Orin Nano(RK3576) whisper<b class='flag-5'>語音</b><b class='flag-5'>識別</b>訓(xùn)練部署教程

    芯知識|語音芯片發(fā)碼無聲解析:上電無聲、連發(fā)指令才響的大根源及解決之道

    在嵌入式語音方案開發(fā)中,廣州唯創(chuàng)電子語音芯片(如WT系列)以其高性價(jià)比和易用性廣受青睞。但當(dāng)開發(fā)者遭遇“上電發(fā)碼無聲”或“必須連發(fā)兩次指令才有聲音”的問題時(shí),往往陷入調(diào)試?yán)Ь场1疚膶⑸钊肫饰鲞@些現(xiàn)象
    的頭像 發(fā)表于 06-19 09:14 ?433次閱讀
    芯知識|<b class='flag-5'>語音</b>芯片發(fā)碼<b class='flag-5'>無聲</b>解析:上電<b class='flag-5'>無聲</b>、連發(fā)指令才響的<b class='flag-5'>三</b>大根源及解決之道

    明遠(yuǎn)智睿SSD2351開發(fā)板:語音機(jī)器人領(lǐng)域的變革力量

    的四核1.4GHz處理器具備強(qiáng)勁的運(yùn)算性能,能夠高效處理語音機(jī)器人運(yùn)行過程中的復(fù)雜任務(wù)。語音識別和合成需要大量的計(jì)算資源,該處理器可以快速對
    發(fā)表于 05-28 11:36

    廠家芯資訊|WTK6900系列語音識別芯片:精準(zhǔn)交互,智創(chuàng)未來

    “芯片性能+算法優(yōu)化+場景適配”位一體的解決方案,將標(biāo)準(zhǔn)方案識別率提升至97%,為行業(yè)樹立技術(shù)標(biāo)桿。一、WTK6900系列:破解語音識別難題的核心利器1.高性能
    的頭像 發(fā)表于 03-19 09:12 ?760次閱讀
    廠家芯資訊|WTK6900系列<b class='flag-5'>語音</b><b class='flag-5'>識別</b>芯片:<b class='flag-5'>精準(zhǔn)</b>交互,智創(chuàng)未來

    空調(diào)語音控制方案NRK3501語音識別芯片-讓智能生活觸手可及!

    NRK3501語音識別芯片支持離線語音控制空調(diào),精準(zhǔn)識別,遠(yuǎn)場降噪,最多支持200條離線指令,5米內(nèi)識別
    的頭像 發(fā)表于 01-07 11:40 ?1110次閱讀
    空調(diào)<b class='flag-5'>語音</b>控制方案NRK3501<b class='flag-5'>語音</b><b class='flag-5'>識別</b>芯片-讓智能生活觸手可及!

    智能語音的驅(qū)動(dòng)力:揭秘8腳語音芯片在智能設(shè)備中的非凡角色

    語音技術(shù)滲透生活,8腳語音芯片以微縮體積、低功耗、卓越性能成智能設(shè)備語音功能核心,集成識別、合成、壓縮解碼等功能,實(shí)現(xiàn)精準(zhǔn)
    的頭像 發(fā)表于 12-02 14:23 ?689次閱讀

    語音識別技術(shù)在醫(yī)療領(lǐng)域的應(yīng)用

    語音識別技術(shù)在醫(yī)療領(lǐng)域的應(yīng)用已經(jīng)越來越廣泛,為醫(yī)療服務(wù)帶來了諸多便利和效率提升。以下是對語音識別技術(shù)在醫(yī)療領(lǐng)域應(yīng)用的介紹: 一、語音病歷
    的頭像 發(fā)表于 11-26 09:35 ?1527次閱讀

    語音識別與自然語言處理的關(guān)系

    在人工智能的快速發(fā)展中,語音識別和自然語言處理(NLP)成為了兩個(gè)重要的技術(shù)支柱。語音識別技術(shù)使得機(jī)器能夠理解人類的語音,而自然語言處理則讓
    的頭像 發(fā)表于 11-26 09:21 ?1908次閱讀

    語音識別技術(shù)的應(yīng)用與發(fā)展

    語音識別技術(shù)的發(fā)展可以追溯到20世紀(jì)50年代,但直到近年來,隨著計(jì)算能力的提升和機(jī)器學(xué)習(xí)技術(shù)的進(jìn)步,這項(xiàng)技術(shù)才真正成熟并廣泛應(yīng)用于各個(gè)領(lǐng)域。語音識別
    的頭像 發(fā)表于 11-26 09:20 ?2049次閱讀

    ASR與傳統(tǒng)語音識別的區(qū)別

    ASR(Automatic Speech Recognition,自動(dòng)語音識別)與傳統(tǒng)語音識別在多個(gè)方面存在顯著的區(qū)別。以下是對這兩者的對比: 一、技術(shù)基礎(chǔ) ASR : 基于深度學(xué)習(xí)算
    的頭像 發(fā)表于 11-18 15:22 ?1797次閱讀

    ASR語音識別技術(shù)應(yīng)用

    ASR(Automatic Speech Recognition)語音識別技術(shù),是計(jì)算機(jī)科學(xué)與人工智能領(lǐng)域的重要突破,能將人類語音轉(zhuǎn)換為文本,廣泛應(yīng)用于智能家居、醫(yī)療、交通等多個(gè)領(lǐng)域。以下是對ASR
    的頭像 發(fā)表于 11-18 15:12 ?2541次閱讀

    基于Arm Neoverse N2實(shí)現(xiàn)自動(dòng)語音識別技術(shù)

    自動(dòng)語音識別 (Automatic Speech Recognition) 技術(shù)已經(jīng)深入到現(xiàn)代生活的方方面面,廣泛應(yīng)用于從語音助手、轉(zhuǎn)錄服務(wù),到呼叫中心分析和
    的頭像 發(fā)表于 11-15 11:35 ?1539次閱讀
    基于Arm Neoverse N2實(shí)現(xiàn)自動(dòng)<b class='flag-5'>語音</b><b class='flag-5'>識別</b>技術(shù)