chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

揭秘語音交互:個(gè)性化AI打造“數(shù)字化的你”

章鷹觀察 ? 來源:高通 ? 作者:侯紀(jì)磊博士 ? 2018-07-18 15:42 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

從更精美的照片、更高的安全性到更自然的用戶界面(UI),人工智能AI)正以無縫的方式更多地豐富我們的生活。高能效和個(gè)性化是Qualcomm AI Research的核心研究領(lǐng)域,因?yàn)樗鼈儗?duì)于下一代無處不在的智能用戶體驗(yàn)而言不可或缺。終端側(cè)AI正在支持虛擬助理的發(fā)展,而個(gè)性化正成為今天的虛擬助理和未來真正個(gè)人助理之間的主要差異。

AI驅(qū)動(dòng)語音交互革命

語音是我們一直期盼的變革性交互方式,它可以提供用戶與終端間的自然交互,而無需任何手部操作。先進(jìn)的語音交互具有始終開啟、對(duì)話式、個(gè)性化和私密的特征,可支持我們進(jìn)行高效且自然的對(duì)話。從智能手機(jī)、智能音箱到擴(kuò)展現(xiàn)實(shí)(XR)設(shè)備和汽車,語音交互正在眾多產(chǎn)品種類中日益發(fā)展和普及。

要實(shí)現(xiàn)端到端的語音交互體驗(yàn),其中需要多個(gè)組件的支持(見圖1)。語音交互的流程是這樣的:首先麥克風(fēng)采集語音信號(hào),然后是語音預(yù)處理、語音激活、語音識(shí)別和自然語言理解,最終是終端通過語音合成的方式響應(yīng)用戶。由此可見,端到端的語音交互是個(gè)多步驟的復(fù)雜流程。

圖1:語音交互的功能組件。

為什么今天語音交互變得如此普及?一個(gè)重要因素是,機(jī)器學(xué)習(xí)已經(jīng)點(diǎn)燃了語音交互的革命。機(jī)器語音識(shí)別的準(zhǔn)確率正不斷逼近95%,達(dá)到與人類準(zhǔn)確率相當(dāng)?shù)乃健.?dāng)機(jī)器準(zhǔn)確率不能達(dá)到人類的水平,整個(gè)語音交互過程就沒法做到對(duì)話式的自然高效交流,因此用戶體驗(yàn)會(huì)有顯著下降。機(jī)器學(xué)習(xí)技術(shù)可應(yīng)用于幾乎所有的語音交互組件之上,從而提升各方面及整體的交互體驗(yàn)。

終端側(cè)的語音交互至關(guān)重要

因計(jì)算、內(nèi)存和功率的限制,主要語音交互組件(如自動(dòng)語音識(shí)別和自然語言處理)傳統(tǒng)上都由云端AI所支持。但是,終端側(cè)處理具有眾多獨(dú)特的優(yōu)勢,包括更快的響應(yīng)速度、更高的可靠性和更好的隱私保護(hù)。尤其是在私密性方面,今天的消費(fèi)者渴望把數(shù)據(jù)掌握在自己手中,并且有權(quán)選擇是否將數(shù)據(jù)發(fā)到云端進(jìn)行處理或存儲(chǔ)。因此,更多在終端上進(jìn)行處理并為云端功能提供補(bǔ)充,這是目前行業(yè)的重要趨勢之一。而其中的主要挑戰(zhàn)在于,需要在移動(dòng)終端的功耗和散熱限制下運(yùn)行并實(shí)現(xiàn)復(fù)雜的語音交互功能。

圖2:語音交互的主要組件正向終端側(cè)遷移。

Qualcomm正積極應(yīng)對(duì)這項(xiàng)挑戰(zhàn),并把低功耗的終端側(cè)AI應(yīng)用于語音交互組件之上。以下是幾個(gè)例子:

1、語音降噪將帶噪語音處理成清晰語音并輸出,這在嘈雜環(huán)境中尤其重要。Qualcomm AI Research正在開發(fā)一個(gè)降噪深度學(xué)習(xí)模型,該模型與傳統(tǒng)方法相比有顯著的性能提升,并具有較高效率可在助聽器這樣非常受限的處理能力、功耗和散熱條件下運(yùn)行。

2、 自動(dòng)語音識(shí)別將語音轉(zhuǎn)錄為文本。測試表明,深度學(xué)習(xí)技術(shù)可在移動(dòng)終端上實(shí)現(xiàn)頂級(jí)的語音識(shí)別準(zhǔn)確率。Qualcomm AI Research已經(jīng)完成了一個(gè)深度學(xué)習(xí)聲學(xué)模型的訓(xùn)練并使其適應(yīng)每個(gè)用戶的口音和環(huán)境,從而提高個(gè)性化程度。

今天,終端側(cè)的語音交互已經(jīng)成為現(xiàn)實(shí)。Qualcomm AI Research已經(jīng)可以在終端側(cè)實(shí)現(xiàn)整體的端到端語音交互處理,并在2018年的CES大會(huì)上演示了智能家居中的端到端語音交互體驗(yàn)。在適應(yīng)口音和環(huán)境后,這項(xiàng)演示對(duì)特定領(lǐng)域的指令集已經(jīng)可以實(shí)現(xiàn)超過95%的意圖理解準(zhǔn)確率。

個(gè)性化成就真正的虛擬助理

真正的虛擬助理是在終端里面有一個(gè)“數(shù)字化的我”。因此,它需要分析個(gè)人信息并不斷學(xué)習(xí)用戶偏好,從而成為真正了解用戶的數(shù)字助理。情境式智能是實(shí)現(xiàn)個(gè)性化的必備條件,而實(shí)現(xiàn)情景式智能需要融合多種終端側(cè)傳感器的數(shù)據(jù)(如麥克風(fēng)、攝像頭和陀螺儀)及其他終端側(cè)和終端外數(shù)據(jù)(見圖3)。

圖3:情境式智能融合多種傳感器和個(gè)人信息。

增強(qiáng)個(gè)性化的一大好處在于,它能夠推動(dòng)個(gè)人助理進(jìn)一步發(fā)展并兼具響應(yīng)性和主動(dòng)性。真正的個(gè)人助理不僅能夠在用戶提問時(shí)提供個(gè)性化的答案,還能基于情境分析進(jìn)行自主決策和無提示對(duì)話。

為進(jìn)一步提升虛擬助理的個(gè)性化程度,Qualcomm AI Research正對(duì)終端側(cè)的“AI agent”展開研究,它有望從所有傳感器數(shù)據(jù)中不斷學(xué)習(xí)個(gè)人信息,最終實(shí)現(xiàn)直觀行動(dòng)。AI agent的關(guān)鍵功能包括情境式融合及學(xué)習(xí),這最終將支持個(gè)性化響應(yīng)并豐富我們的生活。初步研究結(jié)果已展現(xiàn)出終端側(cè)個(gè)性化的遠(yuǎn)大前景。個(gè)性化不僅將提升虛擬個(gè)人助理的用戶體驗(yàn),而且將豐富我們生活的方方面面。這項(xiàng)技術(shù)將變革眾多行業(yè),不斷推動(dòng)行業(yè)創(chuàng)新。

(本文內(nèi)容來自Qualcomm高級(jí)總監(jiān)兼AI研究項(xiàng)目負(fù)責(zé)人侯紀(jì)磊博士的署名博客)

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 傳感器
    +關(guān)注

    關(guān)注

    2565

    文章

    52930

    瀏覽量

    766854
  • AI
    AI
    +關(guān)注

    關(guān)注

    88

    文章

    35041

    瀏覽量

    279119
  • 機(jī)器學(xué)習(xí)

    關(guān)注

    66

    文章

    8501

    瀏覽量

    134542
  • 語音交互
    +關(guān)注

    關(guān)注

    3

    文章

    307

    瀏覽量

    28604
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    2025年電商API發(fā)展趨勢:智能個(gè)性化

    ? 引言 隨著數(shù)字經(jīng)濟(jì)的深化,電商API(應(yīng)用程序接口)已成為連接平臺(tái)、商家與用戶的核心樞紐。2025年,在人工智能與大數(shù)據(jù)驅(qū)動(dòng)下,電商API將加速向 智能決策 與 個(gè)性化服務(wù) 演進(jìn),重構(gòu)用戶
    的頭像 發(fā)表于 07-11 14:26 ?99次閱讀
    2025年電商API發(fā)展趨勢:智能<b class='flag-5'>化</b>與<b class='flag-5'>個(gè)性化</b>

    聲紋解鎖個(gè)性化!啟明云端硅思物語AI平臺(tái)讓設(shè)備“認(rèn)準(zhǔn)的聲音”

    啟明云端依托旗下硅思物語AI平臺(tái),通過聲紋采集技術(shù),在ESP32-S3潮玩手辦伴侶上構(gòu)建的個(gè)性化智能助手的真實(shí)落地應(yīng)用場景。聲紋采集:的聲音就是“生物密碼”什么是聲紋?聲紋如同指
    的頭像 發(fā)表于 06-17 18:02 ?429次閱讀
    聲紋解鎖<b class='flag-5'>個(gè)性化</b>!啟明云端硅思物語<b class='flag-5'>AI</b>平臺(tái)讓設(shè)備“認(rèn)準(zhǔn)<b class='flag-5'>你</b>的聲音”

    EM儲(chǔ)能網(wǎng)關(guān) ZWS智慧儲(chǔ)能云應(yīng)用(13) — 企業(yè)個(gè)性化配置

    儲(chǔ)能公有云平臺(tái),企業(yè)用戶如何自主個(gè)性化配置?ZWS智慧儲(chǔ)能云通過靈活的多級(jí)配置功能,實(shí)現(xiàn)個(gè)性化系統(tǒng)配置,幫助強(qiáng)化儲(chǔ)能企業(yè)獨(dú)特性。簡介儲(chǔ)能企業(yè)在使用智慧儲(chǔ)能云平臺(tái)時(shí),常面臨企業(yè)個(gè)性化和品牌展示
    的頭像 發(fā)表于 05-23 11:39 ?163次閱讀
    EM儲(chǔ)能網(wǎng)關(guān) ZWS智慧儲(chǔ)能云應(yīng)用(13) — 企業(yè)<b class='flag-5'>個(gè)性化</b>配置

    AI賦能,健康無界:WT2605C語音芯片智能血壓計(jì)的個(gè)性化設(shè)計(jì)方案

    :數(shù)據(jù)如何解讀?異常如何干預(yù)?風(fēng)險(xiǎn)如何預(yù)防?WT2605C芯片方案的誕生,通過“AI對(duì)話+云端互聯(lián)+個(gè)性化服務(wù)”三重技術(shù)突破,重新定義了血壓計(jì)的價(jià)值邊界——它不僅是一
    的頭像 發(fā)表于 04-16 08:57 ?261次閱讀
    <b class='flag-5'>AI</b>賦能,健康無界:WT2605C<b class='flag-5'>語音</b>芯片智能血壓計(jì)的<b class='flag-5'>個(gè)性化</b>設(shè)計(jì)方案

    華為云 Flexus 數(shù)字人創(chuàng)新技術(shù),賦能中小企業(yè)打造個(gè)性化營銷體驗(yàn)

    等等,不僅提高了服務(wù)效率,還為用戶提供了更加個(gè)性化的體驗(yàn)。但中小企業(yè)受數(shù)字人制作成本和技術(shù)門檻的限制,在數(shù)字化的競爭中并不占優(yōu)勢。 直到華為云 Flexus 數(shù)字人的出現(xiàn),才為中小企業(yè)
    的頭像 發(fā)表于 03-10 10:38 ?1299次閱讀
    華為云 Flexus <b class='flag-5'>數(shù)字</b>人創(chuàng)新技術(shù),賦能中小企業(yè)<b class='flag-5'>打造</b><b class='flag-5'>個(gè)性化</b>營銷體驗(yàn)

    Melexis LED驅(qū)動(dòng)方案助力汽車制造商打造個(gè)性化車內(nèi)空間

    汽車內(nèi)飾氛圍燈,早已不再是簡單的照明工具,更是提升駕乘體驗(yàn)、展現(xiàn)個(gè)性化風(fēng)格的重要元素。從靜態(tài)的色彩點(diǎn)綴到動(dòng)態(tài)的燈光秀,車內(nèi)燈光正變得越來越智能、復(fù)雜。面對(duì)這一趨勢,Melexis提供一系列高性能LED驅(qū)動(dòng)方案,以卓越的性能、靈活的擴(kuò)展性和強(qiáng)大的通訊能力,為汽車制造商打造
    的頭像 發(fā)表于 02-21 17:04 ?1671次閱讀

    三星發(fā)布Vision AI,打造個(gè)性化AI屏幕體驗(yàn)

    近日,在2025年國際消費(fèi)電子展(CES 2025)“First Look”活動(dòng)上,三星震撼發(fā)布了其最新的科技成果——三星Vision AI。這一創(chuàng)新技術(shù)旨在通過個(gè)性化AI屏幕體驗(yàn),為用戶帶來
    的頭像 發(fā)表于 01-14 14:58 ?778次閱讀

    解鎖個(gè)性化語音交互新時(shí)代:九芯智能語音云平臺(tái),讓創(chuàng)意聲音觸手可及!

    九芯智能語音云平臺(tái)提供全面高效安全的智能語音服務(wù),支持自定義語音內(nèi)容,簡化燒錄流程,依托AI技術(shù),助力各行業(yè)智能升級(jí),引領(lǐng)
    的頭像 發(fā)表于 01-02 16:51 ?878次閱讀
    解鎖<b class='flag-5'>個(gè)性化</b><b class='flag-5'>語音</b><b class='flag-5'>交互</b>新時(shí)代:九芯智能<b class='flag-5'>語音</b>云平臺(tái),讓創(chuàng)意聲音觸手可及!

    語音芯片賦能可穿戴設(shè)備:開啟個(gè)性化音頻新體驗(yàn)

    語音芯片與可穿戴設(shè)備合作,帶來定制音效、智能降噪、個(gè)性化推薦、語音交互及跨設(shè)備共享等,引領(lǐng)個(gè)性化
    的頭像 發(fā)表于 12-14 15:44 ?918次閱讀

    4G模組PWM調(diào)光入門:打造個(gè)性化呼吸燈

    一直有朋友問我怎么打造個(gè)性化呼吸燈,本文我將以合宙低功耗4G模組經(jīng)典型號(hào)——Air780E為例,展示PWM輸出呼吸燈的實(shí)現(xiàn)方法,幫助大家深入理解如何在項(xiàng)目中應(yīng)用PWM技術(shù)。
    的頭像 發(fā)表于 11-17 09:56 ?627次閱讀
    4G模組PWM調(diào)光入門:<b class='flag-5'>打造</b><b class='flag-5'>個(gè)性化</b>呼吸燈

    智慧路燈照明管理系統(tǒng),呈現(xiàn)個(gè)性化城市照明效果

    【智慧城市】智慧路燈照明管理系統(tǒng),呈現(xiàn)個(gè)性化城市照明效果
    的頭像 發(fā)表于 10-28 14:39 ?825次閱讀
    智慧路燈照明管理系統(tǒng),呈現(xiàn)<b class='flag-5'>個(gè)性化</b>城市照明效果

    AI破解個(gè)性化客服難題

    一文匯集多個(gè)行業(yè)借助 AI 實(shí)現(xiàn)的個(gè)性化客服實(shí)踐
    的頭像 發(fā)表于 10-25 09:06 ?2390次閱讀
    以<b class='flag-5'>AI</b>破解<b class='flag-5'>個(gè)性化</b>客服難題

    高速數(shù)字化儀的技術(shù)原理和應(yīng)用場景

    高速數(shù)字化儀是一種用于采集高速模擬信號(hào),并將其轉(zhuǎn)換為數(shù)字信號(hào)進(jìn)行處理和儲(chǔ)存的設(shè)備。以下是對(duì)其技術(shù)原理和應(yīng)用場景的詳細(xì)介紹:一、技術(shù)原理 采樣:高速數(shù)字化儀的采樣率是指每秒鐘采樣多少次,采樣率越高
    發(fā)表于 10-21 14:34

    高校轉(zhuǎn)型數(shù)字化的原因有哪些

    作為知識(shí)傳播和創(chuàng)新的重要場所,必須緊跟科技發(fā)展的步伐,通過數(shù)字化轉(zhuǎn)型來適應(yīng)這一趨勢,確保自身在激烈的競爭中保持領(lǐng)先地位。 提升教學(xué)質(zhì)量與效率: 數(shù)字化技術(shù)為教學(xué)提供了更加豐富、靈活和個(gè)性化的手段。通過在線課程、
    的頭像 發(fā)表于 09-26 10:39 ?547次閱讀

    Meta發(fā)布Imagine Yourself AI模型,重塑個(gè)性化圖像生成未來

    Meta公司近日在人工智能領(lǐng)域邁出了重要一步,隆重推出了其創(chuàng)新之作——“Imagine Yourself”AI模型,這一突破性技術(shù)為個(gè)性化圖像生成領(lǐng)域帶來了前所未有的變革。在社交媒體與虛擬現(xiàn)實(shí)技術(shù)
    的頭像 發(fā)表于 08-26 10:59 ?995次閱讀