chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

有關(guān)設(shè)計(jì)對(duì)語(yǔ)音用戶(hù)界面的一些挑戰(zhàn)和最佳做法

星星科技指導(dǎo)員 ? 來(lái)源:嵌入式計(jì)算設(shè)計(jì) ? 作者:Jeff LeBlanc ? 2022-12-02 11:47 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

語(yǔ)音交互是21世紀(jì)最具顛覆性的技術(shù)之一。每天都有越來(lái)越多的設(shè)備通過(guò)語(yǔ)音用戶(hù)界面(VUI)組件進(jìn)入市場(chǎng)。雖然語(yǔ)音支持設(shè)備的許多技術(shù)挑戰(zhàn)已經(jīng)得到解決,但讓最終用戶(hù)滿意地使用設(shè)備的體驗(yàn)仍然是一個(gè)懸而未決的問(wèn)題。本文介紹了有關(guān)設(shè)計(jì)對(duì)用戶(hù)有效、自然且引人入勝的 VUI 的一些挑戰(zhàn)和最佳做法,包括設(shè)計(jì)置信度閾值、適應(yīng)插入、使用 n 最佳列表,以及如何在實(shí)際對(duì)話中與用戶(hù)交談(而不是在用戶(hù)處)。

雖然語(yǔ)音用戶(hù)界面(VUI)自1968年以來(lái)一直處于公眾心態(tài)的邊緣,當(dāng)時(shí)HAL和Dave Bowman存在分歧,但直到Tony Stark在2008年開(kāi)始與J.A.R.V.I.S.開(kāi)玩笑,有用的語(yǔ)音控制“智能家居”的概念才開(kāi)始成為焦點(diǎn)。

這款大獲成功的Amazon Echo設(shè)備于2014年發(fā)布,將最新的語(yǔ)音識(shí)別技術(shù)與強(qiáng)大的基于云的計(jì)算相結(jié)合,提供幾乎可與電影中描繪的相媲美的家庭體驗(yàn)。打開(kāi)燈或音響系統(tǒng)從未如此簡(jiǎn)單。

從那以后,谷歌、蘋(píng)果和其他科技公司加入了這場(chǎng)爭(zhēng)斗,并相互絆倒,為您的家庭、工作場(chǎng)所和汽車(chē)提供最佳的交互式語(yǔ)音體驗(yàn)。

這項(xiàng)技術(shù)已經(jīng)有很長(zhǎng)一段時(shí)間了。貝爾實(shí)驗(yàn)室和IBM早在1950年代就致力于語(yǔ)音系統(tǒng)。但是,直到 1990 年代后期,Dragon‘s NaturalSpeak 軟件才獲得了足夠的吸引力,將語(yǔ)音識(shí)別帶入了消費(fèi)者的集體意識(shí)。雖然在當(dāng)時(shí)是革命性的,但NaturalPeaks需要最終用戶(hù)進(jìn)行相當(dāng)多的“培訓(xùn)”才能達(dá)到90%的準(zhǔn)確率,這使得語(yǔ)音識(shí)別作為一種人機(jī)交互形式可行。因此,這項(xiàng)技術(shù)并不像它可能的那樣自然。

多年來(lái),開(kāi)發(fā)人員、設(shè)計(jì)師和技術(shù)人員一直在努力工作,試圖“解決語(yǔ)音問(wèn)題”。然而,我們?cè)谧R(shí)別準(zhǔn)確率方面只增加了5%。

那么,為什么設(shè)計(jì)更準(zhǔn)確、更像人類(lèi)的語(yǔ)音界面如此困難呢?

在設(shè)計(jì)VUI時(shí),必須解決兩個(gè)關(guān)鍵方面。首先是確保界面能夠?qū)⒙曇糇R(shí)別為人類(lèi)語(yǔ)音。這被稱(chēng)為自動(dòng)語(yǔ)音識(shí)別 (ASR),是語(yǔ)音轉(zhuǎn)文本軟件引擎的核心。ASR 可以在現(xiàn)代消費(fèi)類(lèi)硬件上以合理的處理速度執(zhí)行。但是,ASR 通常在云中完成。像Amazon Echo這樣的設(shè)備只做足夠的本地處理來(lái)找到它們的“喚醒詞”,而其余的工作則由遠(yuǎn)程計(jì)算資源完成。所以,是的,Alexa正在聽(tīng)你說(shuō)的一切。但她只在乎你說(shuō)她的名字。

語(yǔ)音體驗(yàn)的第二個(gè)也是更困難的方面是確保設(shè)備在識(shí)別語(yǔ)音后知道如何處理語(yǔ)音。自然語(yǔ)言理解(NLU)結(jié)合了包括語(yǔ)言學(xué),認(rèn)知科學(xué)和人工智能在內(nèi)的各種學(xué)科,多年來(lái)一直挑戰(zhàn)著計(jì)算機(jī)科學(xué)家。盡管一些專(zhuān)家認(rèn)為ASR是開(kāi)發(fā)VUI的“困難部分”,但我不同意。多年來(lái),我們一直保持穩(wěn)定在95%左右的準(zhǔn)確率 - 可與人與人之間的交流相媲美。是的,即使是人與人之間的交流也不是100%準(zhǔn)確的。想想你在和另一個(gè)人說(shuō)話時(shí)說(shuō)多少次“嗯?”或“什么?”。然而,這些對(duì)話很容易理解。

作為UX設(shè)計(jì)師,我們面臨的挑戰(zhàn)是弄清楚如何創(chuàng)建卓越的交互式語(yǔ)音體驗(yàn),盡可能接近模仿人與人之間的體驗(yàn)。

這稱(chēng)為自然用戶(hù)界面或 NUI。讓簡(jiǎn)單的命令正常工作很簡(jiǎn)單 - 主要是從話語(yǔ)中提取正確的關(guān)鍵字。例如,讓您的智能家居正確響應(yīng)“打開(kāi)餐廳燈”并不太復(fù)雜。它只涉及創(chuàng)建一個(gè)界面,該界面可以識(shí)別所需的操作(“打開(kāi)”)以及執(zhí)行該操作的內(nèi)容(“餐廳燈”)。

但仍然存在挑戰(zhàn)。由于我們的語(yǔ)音識(shí)別準(zhǔn)確度略低于 100%,因此設(shè)備可能無(wú)法理解你的確切話語(yǔ)。也許語(yǔ)音助手聽(tīng)到你說(shuō)“打開(kāi)餐廳的燈”。雖然人類(lèi)可以輕松地從餐廳跳到餐廳,但在計(jì)算機(jī)的二進(jìn)制世界中并非如此?!坝貌汀辈坏扔凇坝貌汀?,因此您的語(yǔ)音助手無(wú)法理解您在問(wèn)什么。你最終會(huì)感到沮喪,在黑暗中進(jìn)食。

幸運(yùn)的是,我們可以圍繞這一點(diǎn)進(jìn)行設(shè)計(jì)。解決方案在于超越簡(jiǎn)單的話語(yǔ)和命令,讓我們的用戶(hù)參與對(duì)話。

在我們的例子中,智能家居理解你的意圖——你想打開(kāi)餐廳的燈——但它沒(méi)有得到足夠的信息來(lái)執(zhí)行任務(wù)。因此,我們對(duì)VUI進(jìn)行編程,以執(zhí)行人與人交互中的典型操作:要求澄清。我們的智能家居可以回應(yīng)“對(duì)不起,我沒(méi)有完全理解。你想打開(kāi)什么?

這種互動(dòng)建立在置信度的概念之上——你的智能家居有多確定它真的理解了你的要求?如果智能家居非常確定它理解你的請(qǐng)求 - 比如說(shuō)超過(guò)75%的準(zhǔn)確率 - 它可以執(zhí)行它。如果只是有點(diǎn)確定,設(shè)備可以要求澄清。通過(guò)利用置信度和參與對(duì)話,您可以澄清您的請(qǐng)求,而無(wú)需從喚醒詞重新啟動(dòng)整個(gè)命令交互。

N-最佳名單

下一個(gè)設(shè)計(jì)技術(shù)建立在這種對(duì)話方法的基礎(chǔ)上,試圖根據(jù)先前對(duì)話的預(yù)期響應(yīng)來(lái)預(yù)測(cè)你可能會(huì)說(shuō)什么。您的智能家居聽(tīng)到“用餐”而不是“用餐”并非不合理。甚至是其他聽(tīng)起來(lái)相似的詞,如“潛水”。

通過(guò)將這些險(xiǎn)些失誤收集到稱(chēng)為N-best列表中的東西中,您的智能家居可以捕獲可能的可能性?,F(xiàn)在,您家的VUI可以要求您確認(rèn)列表中的單詞,或者繼續(xù)執(zhí)行該命令。讓你的家回答說(shuō):“我想你讓我打開(kāi)餐廳的燈。是嗎?“表明你的家足夠聰明,(很可能)弄清楚你說(shuō)了什么,但又足夠禮貌地仔細(xì)檢查,以防萬(wàn)一它不能100%完全理解這個(gè)要求。

流程圖

流程圖允許VUI設(shè)計(jì)人員繪制出在簡(jiǎn)單交互中發(fā)現(xiàn)的可能分支。繼續(xù)關(guān)于餐廳燈光的對(duì)話,為了確保流暢、自然的對(duì)話,VUI 設(shè)計(jì)師必須考慮您可能的反應(yīng)。您可以用簡(jiǎn)單的“是”來(lái)回答有關(guān)開(kāi)燈的澄清請(qǐng)求。在這種情況下,智能家居應(yīng)該打開(kāi)燈。

但是,如果你聽(tīng)人與人對(duì)話的錄音,它們通常不會(huì)那么干涸。如果你回答“是”而不是“是”怎么辦?或者“沒(méi)錯(cuò)”或“讓它這樣”或任何數(shù)量的肯定?如果你的回答是否定的怎么辦?不。不。呃。你的智能房子知道該怎么做嗎?

這種情況正是為什么檢查列表而不是簡(jiǎn)單的關(guān)鍵字匹配至關(guān)重要的原因。這是實(shí)現(xiàn)最自然交互的最佳方式。

駁船

人與人交流的另一個(gè)值得一提的方面是中斷。有時(shí)我們是不禮貌的——我們不會(huì)等談話中的對(duì)方說(shuō)完才開(kāi)始說(shuō)話。其他時(shí)候,打斷是及時(shí)推進(jìn)對(duì)話的唯一方法。在這兩種情況下,中斷的能力使對(duì)話更加自然。

下面是一個(gè)示例。您進(jìn)入了擋泥板彎曲機(jī)并致電您的保險(xiǎn)公司提出索賠。在公司的自動(dòng)電話系統(tǒng)上收聽(tīng)一長(zhǎng)串選項(xiàng)時(shí),只要聽(tīng)到“按 3 到達(dá)理賠部門(mén)”,您就會(huì)打斷。你急切地點(diǎn)擊“3”鍵,不要費(fèi)心去聽(tīng)列表的其余部分。

這種闖入和中斷對(duì)話的能力是VUI設(shè)計(jì)人員需要結(jié)合的東西,以便創(chuàng)建類(lèi)似人類(lèi)的語(yǔ)音交互。(如果你的服務(wù)員正在閱讀沙拉醬清單,而你說(shuō)“停下,我想要那個(gè),油醋汁”,而他繼續(xù)列出沙拉醬,事情會(huì)變得有點(diǎn)尷尬。亞馬遜Echo在支持闖入方面做得很好,讓用戶(hù)隨時(shí)說(shuō)“Alexa,取消”。

外賣(mài)

設(shè)計(jì)一個(gè)引人注目的、聽(tīng)起來(lái)像人類(lèi)的語(yǔ)音助手當(dāng)然是可能的。例如,谷歌的新Duplex電話機(jī)器人配備了大多數(shù)人常見(jiàn)的會(huì)話抽搐,包括貫穿整個(gè)對(duì)話的“ahs”和“ums”。有些人甚至對(duì)人工智能和人類(lèi)語(yǔ)音之間的界限變得越來(lái)越模糊表示擔(dān)憂。

審核編輯:郭婷

聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 語(yǔ)音識(shí)別
    +關(guān)注

    關(guān)注

    39

    文章

    1804

    瀏覽量

    115583
  • 語(yǔ)音交互
    +關(guān)注

    關(guān)注

    3

    文章

    339

    瀏覽量

    29065
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    瑞薩電子高級(jí)語(yǔ)音用戶(hù)界面解決方案

    語(yǔ)音用戶(hù)界面(VUI)正在徹底改變我們與技術(shù)交互的方式,實(shí)現(xiàn)免提、無(wú)縫的通信。通過(guò)整合先進(jìn)語(yǔ)音命令識(shí)別功能,再加上語(yǔ)音反欺騙和說(shuō)話人識(shí)別功能
    的頭像 發(fā)表于 08-27 09:41 ?514次閱讀
    瑞薩電子高級(jí)<b class='flag-5'>語(yǔ)音</b><b class='flag-5'>用戶(hù)</b><b class='flag-5'>界面</b>解決方案

    分享---簡(jiǎn)單快速實(shí)現(xiàn)烘烤設(shè)備UI界面的方法

    是800x480 編寫(xiě)簡(jiǎn)單腳本,在屏幕上運(yùn)行一些控制邏輯 注意:HMT070DTA-D直接LUA腳本,一些簡(jiǎn)單的控制邏輯,我直接通過(guò)屏幕支持lua腳本,讓屏幕自己控制了。 通過(guò)SGTools自帶的仿真功能,查看效果
    發(fā)表于 08-26 11:58

    顆TTS語(yǔ)音芯給產(chǎn)品增加智能語(yǔ)音播報(bào)能力

    顆TTS語(yǔ)音芯片給產(chǎn)品增加智能語(yǔ)音播報(bào)能力 傳統(tǒng)語(yǔ)音播報(bào)芯片可以設(shè)置一些固定的語(yǔ)音片段或者內(nèi)容
    的頭像 發(fā)表于 08-14 16:33 ?471次閱讀

    語(yǔ)音識(shí)別---大家怎么看呢?

    語(yǔ)音識(shí)別是門(mén)交叉學(xué)科。近二十年來(lái),語(yǔ)音識(shí)別技術(shù)取得顯著進(jìn)步,開(kāi)始從實(shí)驗(yàn)室走向市場(chǎng)。人們預(yù)計(jì),未來(lái)10年內(nèi),語(yǔ)音識(shí)別技術(shù)將進(jìn)入工業(yè)、家電、通信、汽車(chē)電子、醫(yī)療、家庭服務(wù)、消費(fèi)電子產(chǎn)品等
    發(fā)表于 08-09 10:54

    微小泄漏零容忍:結(jié)束線連接器氣密性檢測(cè)的挑戰(zhàn)與對(duì)策

    我們?cè)谑褂媒Y(jié)束線連接器氣密檢測(cè)的時(shí)候會(huì)遇到很多問(wèn)題,那在氣密檢測(cè)中遇到這些挑戰(zhàn),我們?cè)撊绾稳ソ鉀Q呢,下面是一些挑戰(zhàn)和解決對(duì)策:
    的頭像 發(fā)表于 06-04 14:17 ?381次閱讀
    微小泄漏零容忍:結(jié)束線連接器氣密性檢測(cè)的<b class='flag-5'>挑戰(zhàn)</b>與對(duì)策

    使用基于GaN的OBC應(yīng)對(duì)電動(dòng)汽車(chē)EMI傳導(dǎo)發(fā)射挑戰(zhàn)

    本期,為大家?guī)?lái)的是《使用基于 GaN 的 OBC 應(yīng)對(duì)電動(dòng)汽車(chē) EMI 傳導(dǎo)發(fā)射挑戰(zhàn)》,將深入回顧 CISPR 32 對(duì) OBC 的 EMI 要求,同時(shí)詳細(xì)探討可靠數(shù)據(jù)測(cè)量的最佳做法、GaN 對(duì) EMI 頻譜的影響,以及解決傳
    的頭像 發(fā)表于 05-24 15:46 ?4249次閱讀
    使用基于GaN的OBC應(yīng)對(duì)電動(dòng)汽車(chē)EMI傳導(dǎo)發(fā)射<b class='flag-5'>挑戰(zhàn)</b>

    Debian和Ubuntu哪個(gè)好一些?

    兼容性對(duì)比Debian和Ubuntu哪個(gè)好一些,并為您揭示如何通過(guò)RAKsmart服務(wù)器釋放Linux系統(tǒng)的最大潛能。
    的頭像 發(fā)表于 05-07 10:58 ?872次閱讀

    如何添加一些網(wǎng)絡(luò)上的庫(kù)到mpy固件的說(shuō)明或手冊(cè)教程?

    于如何添加一些網(wǎng)絡(luò)上的庫(kù)到mpy固件的說(shuō)明或手冊(cè)教程? 問(wèn)題2: 關(guān)于mpy的image庫(kù)在哪里能了解學(xué)習(xí)內(nèi)部代碼,只了解一些python,想知道怎么從c轉(zhuǎn)換成mpy能調(diào)用的,自己寫(xiě)的c也能轉(zhuǎn)成py調(diào)用
    發(fā)表于 04-29 08:16

    明遠(yuǎn)智睿SSD2351核心板在語(yǔ)音對(duì)講與HMI領(lǐng)域的創(chuàng)新應(yīng)用

    提升了用戶(hù)與設(shè)備之間的交互效率。 在一些高端智能設(shè)備的HMI設(shè)計(jì)中,還會(huì)涉及到3D圖形渲染、動(dòng)畫(huà)效果展示等功能。SSD2351核心板支持浮點(diǎn)運(yùn)算的特性,使其在處理這些復(fù)雜圖形運(yùn)算時(shí)表現(xiàn)出色。例如在智能車(chē)載中
    發(fā)表于 04-16 10:46

    樹(shù)莓派在自動(dòng)化控制項(xiàng)目中的一些潛在應(yīng)用

    自動(dòng)化控制項(xiàng)目中的一些潛在應(yīng)用。之前,我們已經(jīng)為Arduino平臺(tái)探討了相同的話題。我們確定Arduino是個(gè)出色的教育工具,但由于一些限制,它無(wú)法在工業(yè)環(huán)境中完全
    的頭像 發(fā)表于 03-25 09:45 ?480次閱讀
    樹(shù)莓派在自動(dòng)化控制項(xiàng)目中的<b class='flag-5'>一些</b>潛在應(yīng)用

    AN-202: IC放大器用戶(hù)指南:去耦、接地及其他一些要點(diǎn)

    電子發(fā)燒友網(wǎng)站提供《AN-202: IC放大器用戶(hù)指南:去耦、接地及其他一些要點(diǎn).pdf》資料免費(fèi)下載
    發(fā)表于 01-13 15:16 ?3次下載
    AN-202: IC放大器<b class='flag-5'>用戶(hù)</b>指南:去耦、接地及其他<b class='flag-5'>一些</b>要點(diǎn)

    AN29-關(guān)于DC-DC轉(zhuǎn)換器的一些想法

    電子發(fā)燒友網(wǎng)站提供《AN29-關(guān)于DC-DC轉(zhuǎn)換器的一些想法.pdf》資料免費(fèi)下載
    發(fā)表于 01-08 13:57 ?0次下載
    AN29-關(guān)于DC-DC轉(zhuǎn)換器的<b class='flag-5'>一些</b>想法

    HarmonyOS NEXT 應(yīng)用開(kāi)發(fā)練習(xí):AI智能語(yǔ)音播報(bào)

    、DEMO思路 在這個(gè)HarmonyOS NEXT原生應(yīng)用DEMO中,我們將使用ArkTS開(kāi)發(fā)語(yǔ)言創(chuàng)建個(gè)簡(jiǎn)單的AI智能語(yǔ)音播報(bào)應(yīng)用。 該應(yīng)用能夠接收用戶(hù)輸入的文本,并使用TTS
    發(fā)表于 01-06 15:33

    使用DAC37J84時(shí),遇到了一些問(wèn)題求解答

    您好,我在使用DAC37J84時(shí),遇到了一些問(wèn)題,需要您的支持;具體情況如下: 我使用1片DAC37J84與Xilinx的XC7V485T FPGA進(jìn)行通信,具體設(shè)置參數(shù)如下: DAC37J84
    發(fā)表于 01-06 06:36

    SOLIDWORKS 2025直觀的用戶(hù)界面

    在工程設(shè)計(jì)領(lǐng)域,SOLIDWORKS作為三維CAD軟件的佼佼者,直致力于通過(guò)技術(shù)創(chuàng)新提升用戶(hù)體驗(yàn)。隨著SOLIDWORKS 2025版本的發(fā)布,其在界面設(shè)計(jì)上的直觀性與易用性再次成為行業(yè)關(guān)注的焦點(diǎn)
    的頭像 發(fā)表于 12-12 17:22 ?1102次閱讀