chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

淺談 聲音人機(jī)交互技術(shù)

電子工程師 ? 來(lái)源:搜狐 ? 作者:搜狐 ? 2021-03-23 10:09 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

如果你同時(shí)保留著看電視和聽(tīng)廣播這兩個(gè)習(xí)慣——或者,看視頻網(wǎng)站的同時(shí)會(huì)去找些播客節(jié)目聽(tīng)聽(tīng),那么你一定會(huì)注意到一個(gè)顯著的區(qū)別:視頻節(jié)目的豐富程度和制作上的復(fù)雜度遠(yuǎn)高于音頻節(jié)目。例如,《新聞聯(lián)播》的片頭20多年換了四五次,體現(xiàn)了電視技術(shù)的最新進(jìn)步,但片頭音樂(lè)一直不變,人們也能接受。電視節(jié)目的攝影棚幾年就得來(lái)一次大翻新,但現(xiàn)在的廣播電臺(tái)依然可以使用十幾年前的音頻制作系統(tǒng)來(lái)播出節(jié)目,直播間里的時(shí)光仿佛停滯一般。

人類(lèi)在同一時(shí)刻用眼睛可以接收的信息量遠(yuǎn)高于用耳朵能接收到的,視覺(jué)可以判別空間位置、形狀和顏色疊加起來(lái)的豐富信息,比聽(tīng)覺(jué)高了不止一個(gè)維度。在看到人說(shuō)話(huà)的時(shí)候,我們接收到的不只是話(huà)語(yǔ)內(nèi)容,還包括人的面部特征和表情的細(xì)微變動(dòng),這都對(duì)氛圍和情緒有著潛移默化的影響。相應(yīng)的,聽(tīng)覺(jué)接收到的話(huà)語(yǔ)內(nèi)容可以用手語(yǔ)或者字幕替代,但視覺(jué)附加的更多信息卻難以轉(zhuǎn)化回音頻。

歷史上,圖書(shū)和報(bào)紙已經(jīng)給了人們?cè)谝曈X(jué)信息接收方面的訓(xùn)練,人們將排版經(jīng)驗(yàn)延伸到電影和電視上。盡管留聲機(jī)和電影技術(shù)幾乎處于同一時(shí)代,但人們卻寧愿忍受很多年沒(méi)有同期聲的無(wú)聲電影時(shí)代,寧愿用隨便什么音樂(lè)放一下做背景了事??梢?jiàn),人們習(xí)慣上對(duì)圖像比對(duì)聲音重視得多。

同樣,信息時(shí)代的到來(lái)也毫不例外的優(yōu)先偏愛(ài)圖像。90年代電腦同時(shí)具備獨(dú)立的顯卡和聲卡,技術(shù)進(jìn)步之后,人們對(duì)聲卡抱著無(wú)所謂的態(tài)度,卻追求獨(dú)立顯卡和屏幕的畫(huà)質(zhì),以至于追求手機(jī)攝像頭的精度。在交互方面,大家非常注重GUI(圖形用戶(hù)界面),而對(duì)于聲音的設(shè)計(jì)處理一般比較馬虎,還停留在很多年前的水平。

隨著智能手機(jī)帶來(lái)的趨勢(shì),一塊巨大的觸屏成為人們交互的全部載體,跑在上面的應(yīng)用也隨著一股奇怪的扁平化風(fēng)潮而變得越來(lái)越樣式單一,設(shè)計(jì)師為了與眾不同又好用的界面而絞盡腦汁。對(duì)于音頻而言,它終于迎來(lái)了走出冷宮的機(jī)會(huì)。人機(jī)交互的下一波趨勢(shì),將很可能在聲音——而不是圖像——方面迎來(lái)突破。

聲音不重要,還是人們沒(méi)發(fā)現(xiàn)它的重要?

“在汽車(chē)出現(xiàn)之前,人們都以為自己想要一臺(tái)更快的馬車(chē)?!边@句話(huà)大家也許都很熟悉。在iOS 7和微軟Metro界面出現(xiàn)之后,一夜之間各種UI設(shè)計(jì)都趨向于扁平,而流行多年的擬物化設(shè)計(jì)很快就退潮了。這表明,人們的審美態(tài)度是可以因?yàn)橥饨绲膹?qiáng)力驅(qū)動(dòng)而受到很大的改變的,并不是一成不變。所以對(duì)音頻交互也是如此:并不是說(shuō)聲音相對(duì)于圖像而言不重要,而是需求沒(méi)有得到很好的引導(dǎo)。

聲音有什么好處?它是否有足夠潛力成為不可替代的載體呢(為什么我們獲得的是相反的信號(hào),比如交通廣播電臺(tái)即將被打車(chē)軟件的搶單聲埋葬)?

首先,習(xí)慣聲音交互可以讓我們的感覺(jué)器官均衡利用,換句話(huà)說(shuō)就是保護(hù)眼睛。長(zhǎng)期使用手機(jī),比如在地鐵盯著屏幕或者睡覺(jué)之前刷屏,會(huì)出現(xiàn)很多健康問(wèn)題,其實(shí)不僅限于眼睛,手持閱讀介質(zhì)的姿勢(shì)不同,全身都可能受影響。

而且,作為必須全神貫注進(jìn)行的活動(dòng),閱讀(包括觀看視頻)需要完全沉浸進(jìn)去,和外界隔離,引發(fā)的心理問(wèn)題也不容忽視。不管是閱讀長(zhǎng)文還是碎片化消息,眼睛接受的信息量通常過(guò)大,人們接受了過(guò)量的信息,以至于形成信息過(guò)載而不自覺(jué)。

使用聲音可以讓人們強(qiáng)制減少信息攝入量,并更自如的利用碎片時(shí)間。對(duì)孩子而言,聲音(不使用耳機(jī))也是一種親切自然的交互方式,有助于讓孩子早期就接觸電腦,而不用擔(dān)心用眼,孤獨(dú)等副作用。

此外,隨著我們使用智能設(shè)備的“戶(hù)外場(chǎng)景”增多,就像這個(gè)年頭智能手表終于迎來(lái)了春天一樣,為短信息和免提式交互量身定制的聲音也會(huì)派上更大用場(chǎng)。戶(hù)外場(chǎng)景其實(shí)主要就是開(kāi)車(chē)或者是提著東西走路。在這種情況下,顯然眼睛就只是拿來(lái)看路才更合適。

一個(gè)例子是,交通電臺(tái)提交路況信息,從原來(lái)的短信平臺(tái)改為用微信公眾號(hào)發(fā)送語(yǔ)音,電臺(tái)會(huì)直接播出上傳的語(yǔ)音。這樣,司機(jī)可以不停車(chē),用藍(lán)牙耳機(jī)播報(bào)路況,讓整個(gè)交流過(guò)程更像是真正的無(wú)線電臺(tái)一樣。

最后,聲音可以極大的幫助視障人士走入信息化。如果不是親身接觸,你根本無(wú)法想象視覺(jué)在如今的交互中占有如何舉足輕重的地位。完全不用眼睛的網(wǎng)頁(yè)瀏覽,必須忍受讀屏軟件以飛快到基本聽(tīng)不清的速度給你播報(bào)每一個(gè)文字和圖片信息,而很多圖片都沒(méi)有妥當(dāng)?shù)奈谋?a target="_blank">標(biāo)簽,在沒(méi)有充分無(wú)障礙化的頁(yè)面,比如淘寶店鋪,使用者就會(huì)完全陷入迷茫。

在幫助文本信息轉(zhuǎn)語(yǔ)音,方便視障人士方面,騰訊可能是國(guó)內(nèi)公司中嘗試時(shí)間最長(zhǎng)的公司,QQ2010正式支持讀屏軟件并延續(xù)至今,其他應(yīng)用如QQ音樂(lè)也增加了支持。隨著語(yǔ)音命令可用范圍進(jìn)一步擴(kuò)大,電腦之門(mén)將會(huì)更廣闊地對(duì)盲人朋友敞開(kāi)。

讓基于聲音的人機(jī)交互變得更自然

擬人的聲音交互現(xiàn)在來(lái)到一個(gè)艱難的瓶頸期。著名的“恐怖谷理論”認(rèn)為,當(dāng)機(jī)器人與人類(lèi)相像超過(guò)一定程度的時(shí)候,哪怕與人類(lèi)有一點(diǎn)點(diǎn)的差別,都會(huì)顯得非常顯眼刺目,讓整個(gè)機(jī)器人顯得非常僵硬恐怖,讓人有面對(duì)行尸走肉的感覺(jué)。

在廠商跟風(fēng)推進(jìn)語(yǔ)音助手成為所有手機(jī)、手表的標(biāo)準(zhǔn)配置之后,它正逐步降低人們的心理障礙,培養(yǎng)使用習(xí)慣。如上所述,對(duì)待機(jī)器我們很自然的操作方式是“動(dòng)手不動(dòng)口”,對(duì)著機(jī)器說(shuō)話(huà)會(huì)感覺(jué)很奇怪。但是調(diào)戲Siri或者小娜,已經(jīng)一定程度上在幫我們克服這種障礙。

這就給語(yǔ)音助手進(jìn)一步提升智能程度贏得了寶貴的時(shí)間。等到一個(gè)真正如人類(lèi)一般智能的聲音出現(xiàn)時(shí),人們對(duì)于對(duì)著電腦傾訴,侃侃而談,就不會(huì)太排斥,電影《Her》當(dāng)中出現(xiàn)的戀上機(jī)器聲音的情節(jié),也會(huì)獲得更多用戶(hù)的共鳴。

如果一個(gè)虛擬的人類(lèi)聲音始終會(huì)讓人心生抗拒,那最理想的辦法是機(jī)器直接執(zhí)行人類(lèi)短促簡(jiǎn)單的語(yǔ)音命令。比如說(shuō)你走到家門(mén)說(shuō)開(kāi)門(mén),那么就只是把門(mén)打開(kāi),不會(huì)有什么多余的回應(yīng)說(shuō)“好的,我這就把門(mén)打開(kāi)”。

另一種可行的辦法是讓機(jī)器用“顯然不是普通人類(lèi)”的聲音與人交互,比如現(xiàn)在還有點(diǎn)“單字蹦”的Siri和谷歌娘,或者故意用萌化的聲音說(shuō)“主人回家了喵”,類(lèi)似這樣的方法其實(shí)就是在智能不到位的時(shí)候用裝傻賣(mài)萌來(lái)補(bǔ)充。既然不像真人,也就沒(méi)有必要感到不舒服了。

技術(shù)進(jìn)步和概念創(chuàng)新可以互相驅(qū)動(dòng)

當(dāng)我們站在現(xiàn)在回顧iPhone出現(xiàn)之前的手機(jī)市場(chǎng),我們會(huì)發(fā)現(xiàn),現(xiàn)在的應(yīng)用形態(tài)有很多是當(dāng)年不可想象的。這當(dāng)中很多更新都基于硬件交互方式的改進(jìn),比如多點(diǎn)觸摸,GPS、NFC/RFID和各種感應(yīng)器的協(xié)同作用。所以我們有同樣的信心認(rèn)為,只要用心去開(kāi)發(fā)語(yǔ)音的交互功能,就會(huì)出現(xiàn)更多我們現(xiàn)在無(wú)法想象的新的交互方式。

有時(shí)候,當(dāng)新的交互到來(lái)的時(shí)候,我們才會(huì)驚奇的發(fā)現(xiàn)為其鋪墊的技術(shù)因素已經(jīng)成熟;而只要出現(xiàn)一個(gè)合理的產(chǎn)品,它起到的標(biāo)志性作用就會(huì)引導(dǎo)業(yè)界進(jìn)行自主革新,提升性能和降低成本。

在聲音交互方面,Siri就是一個(gè)很好的例子。它需要輸入和輸出技術(shù)——語(yǔ)音識(shí)別和文字轉(zhuǎn)語(yǔ)音共同配合。而Siri出現(xiàn)的時(shí)候,這兩種技術(shù)都已經(jīng)到了接近能用的程度——就中文而言,語(yǔ)音播報(bào)不再那么“單字蹦”了,而多種第三方語(yǔ)音引擎的識(shí)別率更可以在安靜環(huán)境下達(dá)到90%以上,并順理成章成為眾多山寨Siri的選擇。它的結(jié)果就是廠商跟風(fēng)推進(jìn)語(yǔ)音助手成為所有手機(jī)、手表的標(biāo)準(zhǔn)配置。

不管是可穿戴設(shè)備,還是普通的電腦,是家庭游戲機(jī)或客廳的機(jī)頂盒,以至于智能家居和汽車(chē),聲音交互都是非常有用的。但是截至目前,人們對(duì)于它的探索還是非常被動(dòng)。比如說(shuō),只有當(dāng)智能手表在輸入上出現(xiàn)障礙的時(shí)候才想到用語(yǔ)音輸入,而并非主動(dòng)的探索用語(yǔ)音作為屏幕顯示的替代方案。所以,如果進(jìn)一步整合現(xiàn)有技術(shù),能夠給我們帶來(lái)一個(gè)具有示范作用的應(yīng)用,就會(huì)顯著加速業(yè)界對(duì)聲音交互場(chǎng)景的研究。

編輯:jq

聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • RFID
    +關(guān)注

    關(guān)注

    391

    文章

    6448

    瀏覽量

    242473
  • gps
    gps
    +關(guān)注

    關(guān)注

    22

    文章

    2986

    瀏覽量

    169393
  • nfc
    nfc
    +關(guān)注

    關(guān)注

    61

    文章

    1666

    瀏覽量

    182671
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    蘇州唯理科技神經(jīng)腕帶肌電臂環(huán)人機(jī)交互演示

    人機(jī)交互
    jf_74911425
    發(fā)布于 :2025年07月08日 22:02:34

    中山大學(xué):用于呼吸識(shí)別和非接觸式人機(jī)交互的均勻快速響應(yīng)濕度場(chǎng)傳感陣列的可擴(kuò)展制備

    后疫情時(shí)代,公共場(chǎng)合的接觸式人機(jī)交互(Human-Machine Interaction, HMI)界面因需物理接觸存在讓人們感染病毒的風(fēng)險(xiǎn)。相比之下,基于濕度傳感器的非接觸式交互技術(shù)可有效規(guī)避此類(lèi)
    的頭像 發(fā)表于 06-07 16:15 ?147次閱讀
    中山大學(xué):用于呼吸識(shí)別和非接觸式<b class='flag-5'>人機(jī)交互</b>的均勻快速響應(yīng)濕度場(chǎng)傳感陣列的可擴(kuò)展制備

    聲智科技全球首發(fā)新一代人機(jī)交互框架

    全球人工智能產(chǎn)業(yè)正經(jīng)歷人機(jī)交互范式升級(jí)。過(guò)去兩個(gè)月中,以O(shè)penAI、Meta為代表的行業(yè)領(lǐng)軍企業(yè)加速推進(jìn)交互技術(shù)創(chuàng)新迭代,推動(dòng)產(chǎn)業(yè)進(jìn)入關(guān)鍵變革期。值得關(guān)注的是,a16z合伙人Olivia
    的頭像 發(fā)表于 05-12 10:28 ?419次閱讀
    聲智科技全球首發(fā)新一代<b class='flag-5'>人機(jī)交互</b>框架

    聲學(xué)技術(shù)如何重構(gòu)人機(jī)交互生態(tài)

    人機(jī)交互的底層邏輯。隨著非線性聲學(xué)計(jì)算與強(qiáng)化學(xué)習(xí)的深度融合,聲音交互正從“聽(tīng)得見(jiàn)”邁向“聽(tīng)得懂”,并逐漸成為 AI 時(shí)代的重要接口。
    的頭像 發(fā)表于 04-14 13:50 ?401次閱讀

    愛(ài)普生XV7021BB陀螺儀傳感器在人機(jī)交互中的應(yīng)用

    在元宇宙、智能穿戴與工業(yè)自動(dòng)化加速融合的今天,人機(jī)交互的核心挑戰(zhàn)已從“功能實(shí)現(xiàn)”轉(zhuǎn)向“體驗(yàn)升維”。愛(ài)普生XV7021BB單軸陀螺儀傳感器憑借±400°/s高精度角速度測(cè)量0.0016°/s/°C
    的頭像 發(fā)表于 04-01 14:13 ?332次閱讀
    愛(ài)普生XV7021BB陀螺儀傳感器在<b class='flag-5'>人機(jī)交互</b>中的應(yīng)用

    為什么開(kāi)關(guān)柜人機(jī)交互裝置集成一鍵順控,可以替代開(kāi)關(guān)柜操顯裝置

    蜀瑞創(chuàng)新科普:開(kāi)關(guān)柜人機(jī)交互裝置集成一鍵順控在功能集成與簡(jiǎn)化操作、智能化與遠(yuǎn)程監(jiān)控以及可靠性與安全性等方面均表現(xiàn)出顯著優(yōu)勢(shì)。這些優(yōu)勢(shì)使得集成一鍵順控的人機(jī)交互裝置能夠替代傳統(tǒng)的開(kāi)關(guān)柜智能操作裝置,成為現(xiàn)代智能電網(wǎng)發(fā)展的重要組成部分。
    的頭像 發(fā)表于 03-07 10:21 ?560次閱讀
    為什么開(kāi)關(guān)柜<b class='flag-5'>人機(jī)交互</b>裝置集成一鍵順控,可以替代開(kāi)關(guān)柜操顯裝置

    清華牽頭深開(kāi)鴻參與:混合智能人機(jī)交互系統(tǒng)獲批立項(xiàng)

    近日,一個(gè)由清華大學(xué)牽頭、深開(kāi)鴻重點(diǎn)參與的“面向混合智能的自然人機(jī)交互軟硬件系統(tǒng)”研發(fā)計(jì)劃項(xiàng)目,正式獲得了立項(xiàng)批準(zhǔn)。該項(xiàng)目是國(guó)家“十四五”重點(diǎn)研發(fā)計(jì)劃“先進(jìn)計(jì)算與新興軟件”專(zhuān)項(xiàng)中的一項(xiàng)關(guān)鍵核心技術(shù)
    的頭像 發(fā)表于 01-23 16:33 ?844次閱讀

    漢陽(yáng)大學(xué):研發(fā)自供電、原材料基傳感器,開(kāi)啟人機(jī)交互新篇章

    近日, 韓國(guó)漢陽(yáng)大學(xué)王偉教授團(tuán)隊(duì) 在人機(jī)交互技術(shù)領(lǐng)域取得重要突破,提出了一種 自供電 、 原材料基 、 具有最小化信號(hào)通道數(shù) 的傳感器陣列設(shè)計(jì)方法。這一研究為傳感器在低成本、高效人機(jī)交互中的應(yīng)用開(kāi)辟
    的頭像 發(fā)表于 01-06 17:42 ?557次閱讀
    漢陽(yáng)大學(xué):研發(fā)自供電、原材料基傳感器,開(kāi)啟<b class='flag-5'>人機(jī)交互</b>新篇章

    啟英泰倫新推出多意圖自然說(shuō),重塑離線人機(jī)交互新標(biāo)準(zhǔn)!

    智能語(yǔ)音識(shí)別技術(shù)作為人機(jī)交互領(lǐng)域的一場(chǎng)革命性突破,正逐步重塑我們與智能設(shè)備的交互方式。近期,啟英泰倫新推出了多意圖自然說(shuō)技術(shù),進(jìn)一步增強(qiáng)了人機(jī)交互
    的頭像 發(fā)表于 01-03 16:01 ?549次閱讀
    啟英泰倫新推出多意圖自然說(shuō),重塑離線<b class='flag-5'>人機(jī)交互</b>新標(biāo)準(zhǔn)!

    上海交大團(tuán)隊(duì)發(fā)表MEMS視觸覺(jué)融合多模態(tài)人機(jī)交互新進(jìn)展

    ? 近日,上海交通大學(xué)電子信息與電氣工程學(xué)院微米納米加工技術(shù)全國(guó)重點(diǎn)實(shí)驗(yàn)室劉景全團(tuán)隊(duì)和上海交通大學(xué)人工智能學(xué)院盧策吾團(tuán)隊(duì)在人機(jī)交互領(lǐng)域取得重要進(jìn)展,相關(guān)成果以“Capturing forceful
    的頭像 發(fā)表于 11-28 10:50 ?2437次閱讀
    上海交大團(tuán)隊(duì)發(fā)表MEMS視觸覺(jué)融合多模態(tài)<b class='flag-5'>人機(jī)交互</b>新進(jìn)展

    芯海科技ForceTouch3.0:重塑人機(jī)交互新境界

    在追求極致用戶(hù)體驗(yàn)的智能時(shí)代,每一次技術(shù)的革新都是對(duì)未來(lái)的深度探索。芯??萍迹鳛闃I(yè)界領(lǐng)先的芯片設(shè)計(jì)企業(yè),憑借其ForceTouch3.0技術(shù),正引領(lǐng)著一場(chǎng)人機(jī)交互的變革,為智能手機(jī)、智能穿戴、家電乃至汽車(chē)電子等領(lǐng)域注入了全新的
    的頭像 發(fā)表于 11-28 09:20 ?639次閱讀
    芯??萍糉orceTouch3.0:重塑<b class='flag-5'>人機(jī)交互</b>新境界

    新的人機(jī)交互入口?大模型加持、AI眼鏡賽道開(kāi)啟百鏡大戰(zhàn)

    電子發(fā)燒友網(wǎng)報(bào)道(文/莫婷婷)隨著智能眼鏡的出現(xiàn),加之AI技術(shù)的應(yīng)用,AI智能眼鏡被認(rèn)為是下一代人機(jī)交互的入口。在今年,不少品牌廠商都推出了AI智能眼鏡新品,包括李未可推出的Meta Lens
    的頭像 發(fā)表于 11-21 00:57 ?3984次閱讀
    新的<b class='flag-5'>人機(jī)交互</b>入口?大模型加持、AI眼鏡賽道開(kāi)啟百鏡大戰(zhàn)

    具身智能對(duì)人機(jī)交互的影響

    在人工智能的發(fā)展歷程中,人機(jī)交互一直是研究的核心領(lǐng)域之一。隨著技術(shù)的進(jìn)步,人機(jī)交互的方式也在不斷演變。從最初的命令行界面,到圖形用戶(hù)界面,再到現(xiàn)在的自然語(yǔ)言處理和語(yǔ)音識(shí)別,每一次技術(shù)
    的頭像 發(fā)表于 10-27 09:58 ?967次閱讀

    DJN人機(jī)交互解決方案

    技術(shù)是智能化中不可或缺的重要組成元素,是人機(jī)交互的重要媒介,能有效將智能化終端的運(yùn)行狀態(tài)通過(guò)顯示屏直觀的反饋給人,同時(shí)通過(guò)觸控顯示屏將人類(lèi)的操作直接精確的傳達(dá)給智能化終端。 帝晶HMI智慧屏解決方案,旨在提供專(zhuān)業(yè)的觸控
    的頭像 發(fā)表于 10-12 09:29 ?1497次閱讀

    聚徽-工控一體機(jī)是如何實(shí)現(xiàn)人機(jī)交互

    工控一體機(jī)實(shí)現(xiàn)人機(jī)交互的方式是多種多樣的,結(jié)合搜索結(jié)果,我們可以歸納出以下幾種主要的實(shí)現(xiàn)方式:
    的頭像 發(fā)表于 09-10 09:31 ?657次閱讀