chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

語音交互設(shè)備中的ASR和TTS技術(shù)

安富利 ? 來源:安富利 ? 作者:安富利 ? 2022-06-16 17:23 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

本期導(dǎo)讀

-Hi Siri,今天天氣怎么樣?

-今天天氣晴,18℃至27℃,空氣質(zhì)量指數(shù)36,優(yōu)。

手機(jī)、手表、音箱等智能設(shè)備極大地便利了我們的生活,隨著語音交互設(shè)備的發(fā)展,智能交互依然面臨很多挑戰(zhàn)。

我們每天要說成百上千句話,長短不一。即便是一些轉(zhuǎn)瞬即逝的口頭語,也可以成為傳達(dá)自我意識(shí)的載體,向他人準(zhǔn)確傳達(dá)信息??烧Z言似乎是人類群體特有的專利,在過往的時(shí)間中,想借助語言與其他物種、物體建立清晰明確溝通關(guān)系的可能性無限趨近于零,直到智能語音技術(shù)的出現(xiàn)。

作為最早落地的人工智能技術(shù)之一,AI語音技術(shù)已經(jīng)得到了長足的發(fā)展。如今,智能語音技術(shù)已經(jīng)被廣泛集成的就是家居產(chǎn)品之中。在即將到來的萬物互聯(lián)時(shí)代,以語音交互為主的智能設(shè)備無疑將極具競爭力與吸引力。仔細(xì)一想,一眾充滿科技感與未來感的智能設(shè)備,將天然具備人類最熟悉的“原始交互方式”,也頗有些化繁為簡、返璞歸真的意味。

語音交互設(shè)備的“助聽器”——ASR

在復(fù)雜環(huán)境中,我們總是可以忽略或弱化無關(guān)噪聲,集中注意力進(jìn)行溝通,但語音交互設(shè)備在如此環(huán)境中只會(huì)無所適從,不免陷入“交互尚未開始,便已結(jié)束”的囧境。故此,設(shè)備擁有對各類“聲學(xué)場景”的聲源信號(hào)進(jìn)行處理、優(yōu)化功能的必要性不言而喻。而借助降噪NS、語音增強(qiáng)SE等技術(shù),可以對聲學(xué)場景中的非語音噪音信號(hào)進(jìn)行抑制,從含有噪音的語音信號(hào)中提取純凈語音,提升語音識(shí)別效果,讓語音交互設(shè)備可以分辨、傾聽出目標(biāo)聲音,進(jìn)而為后續(xù)的語音交互掃清障礙。

在語音識(shí)別技術(shù)(ASR)的加持下,語音交互設(shè)備能對聲音信號(hào)進(jìn)行特征提取,提取而出的“特征”會(huì)作為參數(shù),為模型計(jì)算做準(zhǔn)備。簡單理解就是將語音信息數(shù)字化,再通過相應(yīng)的模型對數(shù)字化信息進(jìn)行計(jì)算。后續(xù)通過聲學(xué)模型計(jì)算得出相應(yīng)的音素(即把聲音轉(zhuǎn)成音素),其目的是根據(jù)音素來找到對應(yīng)的漢字或者單詞,最終轉(zhuǎn)換成設(shè)備可以理解的文本。

語音交互設(shè)備的“聲卡”——TTS

基于語音合成技術(shù)(TTS),語音交互設(shè)備可對文本逐句分析,進(jìn)行詞匯、語法的和語義的分析,以確定句子的低層結(jié)構(gòu)和每個(gè)字的所對應(yīng)的音素組成,包括文本的斷句、字詞切分、多音字處理以及數(shù)字處理等。

在內(nèi)置芯片和神經(jīng)網(wǎng)絡(luò)技術(shù)的支持下,語音交互設(shè)備可把處理好的文本所對應(yīng)的單字或短語從語音合成庫中提取,使語言學(xué)描述轉(zhuǎn)化成言語波形,即把文字智能地轉(zhuǎn)化為自然語音流。至此,一次完整的語音交互便成功完成。當(dāng)然,在特有的智能語音控制器作用下,文本輸出的語音音律將會(huì)更加流暢,使得聽者在聽取信息時(shí)感覺自然、毫無機(jī)器語音輸出的冷漠與生澀感。

寫在最后

誠然,已普遍應(yīng)用于智能家居設(shè)備中的語音交互技術(shù)仍面臨諸多挑戰(zhàn),在設(shè)備喚醒率、識(shí)別率、誤報(bào)率、環(huán)境降噪等方面仍有改進(jìn)的空間。但毫無疑問,在未來語音作為人類最自然、最便捷的溝通方式,將會(huì)成為所有設(shè)備和產(chǎn)品至關(guān)重要的入口和人與機(jī)器之間的通信紐帶,而強(qiáng)邏輯、無視覺或者弱視覺的智能語音技術(shù)也會(huì)找到更多用武之地。

原文標(biāo)題:智能交互的盡頭是聊天?

文章出處:【微信公眾號(hào):安富利】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

審核編輯:湯梓紅

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報(bào)投訴
  • ASR
    ASR
    +關(guān)注

    關(guān)注

    2

    文章

    44

    瀏覽量

    19373
  • TTS
    TTS
    +關(guān)注

    關(guān)注

    0

    文章

    62

    瀏覽量

    11455
  • 語音交互
    +關(guān)注

    關(guān)注

    3

    文章

    339

    瀏覽量

    29064

原文標(biāo)題:智能交互的盡頭是聊天?

文章出處:【微信號(hào):AvnetAsia,微信公眾號(hào):安富利】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點(diǎn)推薦

    WT3000TX語音合成芯片TTS:重新定義智能自行車碼表的“聲”動(dòng)體驗(yàn)

    一、智能騎行時(shí)代的語音交互革命1.1從傳統(tǒng)碼表到智能終端的演進(jìn)在智慧出行浪潮的推動(dòng)下,自行車正經(jīng)歷著從傳統(tǒng)代步工具向智能移動(dòng)終端的深刻變革。作為騎行體驗(yàn)的核心交互設(shè)備,自行車碼表亟需突破傳統(tǒng)按鍵操作
    的頭像 發(fā)表于 11-19 09:45 ?441次閱讀
    WT3000TX<b class='flag-5'>語音</b>合成芯片<b class='flag-5'>TTS</b>:重新定義智能自行車碼表的“聲”動(dòng)體驗(yàn)

    語音報(bào)警器:TTS語音播報(bào),云平臺(tái)邏輯自控

    TTS語音播報(bào)報(bào)警器是一種集成了傳統(tǒng)報(bào)警器和TTS(文本轉(zhuǎn)語音)技術(shù)的智能設(shè)備。清晰、準(zhǔn)確地用人
    的頭像 發(fā)表于 10-29 16:31 ?464次閱讀

    語音機(jī)器人交互系統(tǒng):核心技術(shù)與應(yīng)用挑戰(zhàn)

    ? ? ? 語音機(jī)器人交互系統(tǒng)是融合多學(xué)科技術(shù)的復(fù)雜工程,其核心目標(biāo)是實(shí)現(xiàn)人與機(jī)器間的自然、流暢語音對話。該系統(tǒng)已廣泛應(yīng)用于智能客服、智能家居、企業(yè)助手等場景,其
    的頭像 發(fā)表于 09-02 11:08 ?560次閱讀

    基于開源鴻蒙的語音識(shí)別及語音合成應(yīng)用開發(fā)樣例

    本期內(nèi)容由AI Model SIG提供,介紹了在開源鴻蒙,利用sherpa_onnx開源三方庫進(jìn)行ASR語音識(shí)別與TTS語音合成應(yīng)用開發(fā)的
    的頭像 發(fā)表于 08-25 14:26 ?3603次閱讀
    基于開源鴻蒙的<b class='flag-5'>語音</b>識(shí)別及<b class='flag-5'>語音</b>合成應(yīng)用開發(fā)樣例

    從開發(fā)工程師視角看TTS語音合成芯片

    從開發(fā)工程師視角看TTS語音合成芯片 在語音交互領(lǐng)域,TTS 語音合成芯片作為關(guān)鍵角色,正不斷革
    的頭像 發(fā)表于 08-13 14:52 ?649次閱讀

    普強(qiáng)智能語音技術(shù)重新定義車載交互邊界

    普強(qiáng)憑借自主研發(fā)的智能語音技術(shù),為某國內(nèi)頭部車企提供的語音前處理、喚醒詞、ASR、TTS技術(shù)
    的頭像 發(fā)表于 07-11 14:00 ?983次閱讀

    Air8000 TTS開源,語音合成從此“零距離”!

    文本轉(zhuǎn)語音)——是一種將書面文本轉(zhuǎn)換為人類可聽語音技術(shù),通過算法和模型模擬人類發(fā)聲,實(shí)現(xiàn)機(jī)器“說話”。其核心目標(biāo)是生成自然、流暢且富有表現(xiàn)力的語音。 ?
    的頭像 發(fā)表于 07-03 16:33 ?468次閱讀
    Air8000 <b class='flag-5'>TTS</b>開源,<b class='flag-5'>語音</b>合成從此“零距離”!

    廣州唯創(chuàng)電子WT3000A離在線TTS語音提示器芯片IC設(shè)計(jì)方案深度解析

    引言:語音交互的智能化躍遷在全球化與智能化深度融合的今天,語音交互設(shè)備的應(yīng)用場景已從單一提示功能向多語言支持、情感化表達(dá)及AI深度交互演進(jìn)。
    的頭像 發(fā)表于 04-25 09:13 ?608次閱讀
    廣州唯創(chuàng)電子WT3000A離在線<b class='flag-5'>TTS</b><b class='flag-5'>語音</b>提示器芯片IC設(shè)計(jì)方案深度解析

    智能收銀語音交互新標(biāo)桿—WT3000T8語音合成芯片TTS技術(shù)應(yīng)用解析

    一、行業(yè)應(yīng)用背景在零售業(yè)態(tài)智能化轉(zhuǎn)型的浪潮,收銀設(shè)備正經(jīng)歷從功能型向服務(wù)型轉(zhuǎn)變的關(guān)鍵階段。WT3000T8語音合成芯片應(yīng)運(yùn)而生,專為滿足新零售場景下智能收銀終端的語音
    的頭像 發(fā)表于 04-24 08:45 ?631次閱讀
    智能收銀<b class='flag-5'>語音</b><b class='flag-5'>交互</b>新標(biāo)桿—WT3000T8<b class='flag-5'>語音</b>合成芯片<b class='flag-5'>TTS</b><b class='flag-5'>技術(shù)</b>應(yīng)用解析

    WT3000T8-32N語音合成TTS芯片:小體積、強(qiáng)性能,重塑智能語音交互體驗(yàn)

    在萬物互聯(lián)的智能化浪潮,語音交互已成為人機(jī)交互的核心入口。廣州唯創(chuàng)電子推出的WT3000T8-32N語音合成芯片,憑借其4×4mm超小封裝
    的頭像 發(fā)表于 03-21 09:20 ?814次閱讀
    WT3000T8-32N<b class='flag-5'>語音</b>合成<b class='flag-5'>TTS</b>芯片:小體積、強(qiáng)性能,重塑智能<b class='flag-5'>語音</b><b class='flag-5'>交互</b>體驗(yàn)

    TTS語音播報(bào)控制器能做什么?

    TTS(Text-to-Speech)語音播報(bào)控制器,作為一種能夠?qū)⑽谋拘畔⑥D(zhuǎn)換為語音輸出的技術(shù)設(shè)備,在現(xiàn)代社會(huì)的各個(gè)領(lǐng)域中展現(xiàn)出了廣泛的應(yīng)
    的頭像 發(fā)表于 02-20 18:18 ?1110次閱讀

    TTS語音播報(bào)模塊簡介

    的橋梁,不僅在智能家居、車載導(dǎo)航、電子閱讀器等眾多領(lǐng)域發(fā)揮著關(guān)鍵作用,還逐漸滲透到教育、醫(yī)療、娛樂等多個(gè)行業(yè),成為提升用戶體驗(yàn)、增強(qiáng)信息交互效率的重要工具。 TTS語音播報(bào)模塊,作為現(xiàn)代人機(jī)
    的頭像 發(fā)表于 02-18 16:16 ?1895次閱讀

    TTS語音播報(bào)控制器應(yīng)用場景

    TTS(Text-to-Speech)語音播報(bào)控制器,作為一種能夠?qū)⑽谋拘畔⑥D(zhuǎn)換為語音輸出的技術(shù)設(shè)備,在現(xiàn)代社會(huì)的各個(gè)領(lǐng)域中都展現(xiàn)出了廣泛的
    的頭像 發(fā)表于 02-18 16:15 ?1294次閱讀

    HarmonyOS NEXT 應(yīng)用開發(fā)練習(xí):AI智能語音播報(bào)

    一、DEMO思路 在這個(gè)HarmonyOS NEXT原生應(yīng)用DEMO,我們將使用ArkTS開發(fā)語言創(chuàng)建一個(gè)簡單的AI智能語音播報(bào)應(yīng)用。 該應(yīng)用能夠接收用戶輸入的文本,并使用TTS
    發(fā)表于 01-06 15:33

    【「嵌入式系統(tǒng)設(shè)計(jì)與實(shí)現(xiàn)」閱讀體驗(yàn)】+ 基于語音識(shí)別的智能杯墊

    項(xiàng)目二維碼下圖 該作品通過采集飲水?dāng)?shù)據(jù),多種交互方式,數(shù)據(jù)分析處理,提醒用戶定期飲水,達(dá)到保持健康的作用。 主要功能是語音識(shí)別。 ASR-PRO語音模塊是一款高度集成的智能
    發(fā)表于 01-02 18:15