chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

百度智能語(yǔ)音交互的產(chǎn)業(yè)化成果豐碩,推進(jìn)語(yǔ)音技術(shù)應(yīng)用落地

牽手一起夢(mèng) ? 來(lái)源:電科技 ? 作者:辛雯 ? 2020-09-16 15:20 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

9月15日,AI領(lǐng)域的行業(yè)盛會(huì)“百度世界2020”大會(huì)于線上隆重召開(kāi),一大波硬核技術(shù)襲來(lái):百度創(chuàng)始人、董事長(zhǎng)兼CEO李彥宏與總臺(tái)央視主持人康輝“虛擬人”亮相、顛覆搜索形態(tài)的“度曉曉”、沒(méi)有駕駛員的“全自動(dòng)駕駛”、各行各業(yè)賦能案例……既有硬核技術(shù),又有“接地氣”的落地應(yīng)用。

在當(dāng)天的百度大腦分論壇上,百度語(yǔ)音首席架構(gòu)師賈磊重點(diǎn)講解了百度端到端語(yǔ)音交互技術(shù)。他表示,百度語(yǔ)音交互技術(shù)持續(xù)迭代升級(jí),已發(fā)展成為基于深度學(xué)習(xí)技術(shù)的端到端的語(yǔ)音識(shí)別和語(yǔ)音合成技術(shù)。在語(yǔ)音識(shí)別層面,百度推出端到端信號(hào)聲學(xué)一體化建模的技術(shù),語(yǔ)音合成方面,最新的Meitron和單人千面合成個(gè)性化技術(shù)亮相。同時(shí)交出了百度語(yǔ)音技術(shù)最新成績(jī)單:日均調(diào)用量超過(guò)155億次,廣泛應(yīng)用在移動(dòng)端、智能家居、和語(yǔ)音IoT等場(chǎng)景,智能語(yǔ)音產(chǎn)業(yè)化成果豐碩。

會(huì)上,賈磊分別從語(yǔ)音識(shí)別和語(yǔ)音合成兩個(gè)技術(shù)維度詳解了百度語(yǔ)音技術(shù)的發(fā)展迭代和最新成果。在語(yǔ)音識(shí)別方面,百度語(yǔ)音識(shí)別技術(shù)持續(xù)創(chuàng)新,從2012年首推深度學(xué)習(xí)技術(shù),到2019年在業(yè)內(nèi)首先把注意力模型應(yīng)用于在線語(yǔ)音識(shí)別,推出流式多級(jí)的截?cái)嘧⒁饬δP?SMLTA;再到如今全面進(jìn)化為端到端的信號(hào)聲學(xué)一體化建模技術(shù),在助力百度自身業(yè)務(wù)發(fā)展的同時(shí),更好地賦能多場(chǎng)景、多產(chǎn)業(yè)應(yīng)用。

百度智能語(yǔ)音交互的產(chǎn)業(yè)化成果豐碩,推進(jìn)語(yǔ)音技術(shù)應(yīng)用落地

作為百度語(yǔ)音識(shí)別技術(shù)的最新成果,端到端的信號(hào)聲學(xué)一體化建模技術(shù)很好地解決了傳統(tǒng)數(shù)字信號(hào)處理和語(yǔ)音識(shí)別級(jí)聯(lián)系統(tǒng)的各種問(wèn)題,拋棄了各自學(xué)科的學(xué)科假設(shè),通過(guò)端到端的建模,大幅提升了遠(yuǎn)場(chǎng)語(yǔ)音識(shí)別率。

據(jù)賈磊介紹,端到端的信號(hào)聲學(xué)一體化建模技術(shù)由模型波束技術(shù)和模型AEC技術(shù)組成。前者進(jìn)化為多分區(qū)融合的模型波束建模技術(shù),在國(guó)際上由百度首次提出,較單分區(qū)技術(shù)進(jìn)一步提升識(shí)別性能15%以上;后者是升級(jí)為基于雙LOSS實(shí)值掩蔽的模型AEC技術(shù),可以解決設(shè)備有非線性情況下的回波消除問(wèn)題,使得設(shè)備即使在播放音樂(lè)的時(shí)候,也能夠進(jìn)行成功的打斷和高精準(zhǔn)的語(yǔ)音識(shí)別。

此外,賈磊還在會(huì)上介紹了百度今年推出的端側(cè)全雙工語(yǔ)音交互技術(shù)。據(jù)他介紹,百度端側(cè)全雙工語(yǔ)音交互技術(shù)將復(fù)雜的建模過(guò)程轉(zhuǎn)化為3個(gè)端到端的深度學(xué)習(xí)過(guò)程,即信號(hào)聲學(xué)一體化建模、聲學(xué)語(yǔ)言一體化建模以及語(yǔ)義置信一體化建模。通過(guò)端到端的建模,該技術(shù)能夠?qū)⒄麄€(gè)復(fù)雜的端側(cè)交互轉(zhuǎn)變成若干個(gè)深度學(xué)習(xí)計(jì)算,使得依靠一顆AI芯片就能完成端側(cè)的全雙工語(yǔ)音交互,從而大幅度提升車(chē)載手機(jī)等語(yǔ)音交互性能,顯著改善用戶體驗(yàn)。

而在語(yǔ)音合成方面,百度自2013年啟動(dòng)語(yǔ)音合成研發(fā),歷經(jīng)參數(shù)合成、拼接合成、深度學(xué)習(xí)語(yǔ)音合成和端到端的語(yǔ)音合成,到如今全新升級(jí)為包含個(gè)性化、多風(fēng)格多角色、單人千面的語(yǔ)音合成系統(tǒng),百度語(yǔ)音合成技術(shù)始終處于升級(jí)迭代中。

會(huì)上,賈磊依次介紹了百度語(yǔ)音合成技術(shù)的最新成果——個(gè)性化TTS,多風(fēng)格、多角色,單人千面。個(gè)性化TTS是個(gè)性化定制的Meitron語(yǔ)音合成系統(tǒng)的最新演進(jìn),是基于子帶分解和GAN_loss的端側(cè)神經(jīng)網(wǎng)絡(luò)聲碼器,也是業(yè)內(nèi)首個(gè)在手機(jī)端多人通用的端側(cè)的基于神經(jīng)計(jì)算的聲碼器。個(gè)性化TTS相較于傳統(tǒng)的基于信號(hào)處理和參數(shù)的聲碼器,ABX提升可以達(dá)到65:35,其已應(yīng)用于地圖導(dǎo)航,目前每日的導(dǎo)航播報(bào)超過(guò)1億次。

多風(fēng)格、多角色的語(yǔ)音合成,則是針對(duì)娛樂(lè)內(nèi)容產(chǎn)業(yè)(例如小說(shuō))中存在的多個(gè)角色交替、多種情感需求并存的播報(bào)需求而研發(fā)的新技術(shù)。此前,用單一音色播報(bào)缺乏表現(xiàn)力,播報(bào)語(yǔ)音和文字本身的角色情感不一致,用戶長(zhǎng)時(shí)間聽(tīng)感到單調(diào)疲倦。百度通過(guò)深度學(xué)習(xí)技術(shù)對(duì)小說(shuō)文本進(jìn)行分析,判斷出角色、身份、情感,再借助多風(fēng)格、多角色語(yǔ)音合成技術(shù)去合成小說(shuō)中的聲音,從而實(shí)現(xiàn)聲音自然流暢、情感表現(xiàn)力豐富、用戶體驗(yàn)優(yōu)美的效果。

針對(duì)一個(gè)發(fā)音人需要用不同風(fēng)格播報(bào)文本的應(yīng)用場(chǎng)景,百度推出單人千面語(yǔ)音合成技術(shù)。該技術(shù)能夠把說(shuō)話人的語(yǔ)音、文本、風(fēng)格、內(nèi)容、音色都進(jìn)行分離,在進(jìn)行語(yǔ)音合成的時(shí)候自由組合,從而能夠讓一個(gè)發(fā)音人同時(shí)去播報(bào)新聞、小說(shuō)、脫口秀、讀書(shū)、詩(shī)歌等不同風(fēng)格。

“百度智能語(yǔ)音交互的產(chǎn)業(yè)化成果豐碩,目前百度智能語(yǔ)音的日均調(diào)用量超過(guò)155億次,廣泛應(yīng)用于移動(dòng)端、智能家居、智能車(chē)載、智能服務(wù)以及語(yǔ)音IoT,極大地提高了中國(guó)社會(huì)的智能化程度?!辟Z磊表示。語(yǔ)音技術(shù)作為百度大腦的重要AI能力之一,不但應(yīng)用于百度搜索、百度輸入法、百度地圖、小度音箱等百度系列產(chǎn)品,更通過(guò)百度大腦AI開(kāi)放平臺(tái)廣泛賦能眾多行業(yè)和場(chǎng)景的合作伙伴。未來(lái),百度還將持續(xù)創(chuàng)新升級(jí)語(yǔ)音交互技術(shù),推進(jìn)語(yǔ)音技術(shù)應(yīng)用落地,助力更多產(chǎn)業(yè)智能化轉(zhuǎn)型升級(jí)。

責(zé)任編輯:gt

聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 百度
    +關(guān)注

    關(guān)注

    9

    文章

    2375

    瀏覽量

    94530
  • 智能家居
    +關(guān)注

    關(guān)注

    1942

    文章

    9983

    瀏覽量

    197075
  • IOT
    IOT
    +關(guān)注

    關(guān)注

    190

    文章

    4387

    瀏覽量

    207723
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    端到端語(yǔ)音交互革命:百度智能云聯(lián)合地瓜機(jī)器人,重塑AI陪伴體驗(yàn)

    電子發(fā)燒友網(wǎng)報(bào)道(文/莫婷婷)隨著大模型技術(shù)的迅猛發(fā)展,人機(jī)交互正經(jīng)歷從“工具式響應(yīng)”向“擬人化陪伴”的深刻變革。在這一進(jìn)程中,語(yǔ)音交互作為最自然的人機(jī)溝通方式。 ?
    發(fā)表于 12-01 01:07 ?1607次閱讀
    端到端<b class='flag-5'>語(yǔ)音</b><b class='flag-5'>交互</b>革命:<b class='flag-5'>百度</b><b class='flag-5'>智能</b>云聯(lián)合地瓜機(jī)器人,重塑AI陪伴體驗(yàn)

    “芯”聲代,智未來(lái)—VS680本地語(yǔ)音交互系統(tǒng) #語(yǔ)音交互 #芯片

    語(yǔ)音交互
    深蕾半導(dǎo)體
    發(fā)布于 :2025年09月17日 10:59:30

    昆侖芯科技亮相2025百度云智大會(huì)

    近日,2025百度云智大會(huì)在北京國(guó)家會(huì)議中心二期隆重啟幕。本屆大會(huì)以“智能,生成無(wú)限可能”為主題,聚焦人工智能技術(shù)產(chǎn)業(yè)的全鏈條
    的頭像 發(fā)表于 09-01 11:00 ?1150次閱讀

    普強(qiáng)智能語(yǔ)音技術(shù)重新定義車(chē)載交互邊界

    普強(qiáng)憑借自主研發(fā)的智能語(yǔ)音技術(shù),為某國(guó)內(nèi)頭部車(chē)企提供的語(yǔ)音前處理、喚醒詞、ASR、TTS等技術(shù)模塊,構(gòu)建覆蓋泰語(yǔ)、俄語(yǔ)、韓語(yǔ)、日語(yǔ)等多語(yǔ)種的
    的頭像 發(fā)表于 07-11 14:00 ?1092次閱讀

    65%央企大模型落地首選百度智能

    今天,很榮幸地分享一個(gè)好消息,百度智能云已牽手65%的央企,共同推進(jìn)大模型產(chǎn)業(yè)落地。得益于全棧的AI能力,
    的頭像 發(fā)表于 06-11 15:44 ?825次閱讀

    藍(lán)牙語(yǔ)音遙控器:智能家居的智慧控制核心

    和低功耗特性,成為理想選擇。 藍(lán)牙語(yǔ)音遙控器不僅是智能家居控制的樞紐,更是技術(shù)進(jìn)步的縮影。其便捷的操作、智能語(yǔ)音
    發(fā)表于 06-01 20:24

    明遠(yuǎn)智睿SSD2351開(kāi)發(fā)板:語(yǔ)音機(jī)器人領(lǐng)域的變革力量

    接口則讓語(yǔ)音機(jī)器人可以連接到互聯(lián)網(wǎng),實(shí)時(shí)獲取最新的信息,增強(qiáng)其智能性和交互能力。 在實(shí)際應(yīng)用場(chǎng)景中,以智能客服語(yǔ)音機(jī)器人為例。SSD2351
    發(fā)表于 05-28 11:36

    芯資訊|廣州唯創(chuàng)電子WTK6900P語(yǔ)音識(shí)別芯片:離線語(yǔ)音交互的革新者

    智能設(shè)備全面普及的浪潮中,語(yǔ)音交互技術(shù)正逐步從“云端依賴”向“本地化高效處理”演進(jìn)。廣州唯創(chuàng)電子推出的WTK6900P語(yǔ)音識(shí)別芯片,憑借其
    的頭像 發(fā)表于 05-22 09:22 ?708次閱讀
    芯資訊|廣州唯創(chuàng)電子WTK6900P<b class='flag-5'>語(yǔ)音</b>識(shí)別芯片:離線<b class='flag-5'>語(yǔ)音</b><b class='flag-5'>交互</b>的革新者

    芯資訊|廣州唯創(chuàng)電子WTV系列語(yǔ)音芯片:以技術(shù)創(chuàng)新賦能智能語(yǔ)音交互

    在萬(wàn)物互聯(lián)的智能化時(shí)代,語(yǔ)音交互技術(shù)已成為人機(jī)交互的重要橋梁。廣州唯創(chuàng)電子深耕語(yǔ)音芯片領(lǐng)域多年,
    的頭像 發(fā)表于 05-21 08:45 ?640次閱讀
    芯資訊|廣州唯創(chuàng)電子WTV系列<b class='flag-5'>語(yǔ)音</b>芯片:以<b class='flag-5'>技術(shù)</b>創(chuàng)新賦能<b class='flag-5'>智能</b><b class='flag-5'>語(yǔ)音</b><b class='flag-5'>交互</b>

    智能座艙:車(chē)載語(yǔ)音交互測(cè)試內(nèi)容

    隨著汽車(chē)智能化的飛速發(fā)展,車(chē)載語(yǔ)音交互系統(tǒng)已從早期的輔助功能逐漸演變?yōu)?b class='flag-5'>智能座艙的核心交互方式之一。駕駛者通過(guò)
    的頭像 發(fā)表于 04-24 15:29 ?2029次閱讀
    <b class='flag-5'>智能</b>座艙:車(chē)載<b class='flag-5'>語(yǔ)音</b><b class='flag-5'>交互</b>測(cè)試內(nèi)容

    智能收銀語(yǔ)音交互新標(biāo)桿—WT3000T8語(yǔ)音合成芯片TTS技術(shù)應(yīng)用解析

    一、行業(yè)應(yīng)用背景在零售業(yè)態(tài)智能化轉(zhuǎn)型的浪潮中,收銀設(shè)備正經(jīng)歷從功能型向服務(wù)型轉(zhuǎn)變的關(guān)鍵階段。WT3000T8語(yǔ)音合成芯片應(yīng)運(yùn)而生,專為滿足新零售場(chǎng)景下智能收銀終端的語(yǔ)音
    的頭像 發(fā)表于 04-24 08:45 ?743次閱讀
    <b class='flag-5'>智能</b>收銀<b class='flag-5'>語(yǔ)音</b><b class='flag-5'>交互</b>新標(biāo)桿—WT3000T8<b class='flag-5'>語(yǔ)音</b>合成芯片TTS<b class='flag-5'>技術(shù)</b>應(yīng)用解析

    智能語(yǔ)音交互方案在客服領(lǐng)域的應(yīng)用

    著客服行業(yè)的面貌,為企業(yè)和用戶帶來(lái)了全新的體驗(yàn)。 語(yǔ)音識(shí)別模型優(yōu)化私部署 方案:精準(zhǔn)高效,定制專屬服務(wù) 語(yǔ)音識(shí)別技術(shù)作為智能語(yǔ)音
    的頭像 發(fā)表于 04-11 14:35 ?736次閱讀

    百度地圖在汽車(chē)智能化領(lǐng)域的應(yīng)用實(shí)踐

    近日,在中國(guó)電動(dòng)汽車(chē)人會(huì)論壇(2025)的智能汽車(chē)創(chuàng)新技術(shù)產(chǎn)業(yè)論壇,百度地圖事業(yè)部副總經(jīng)理劉增剛發(fā)表主旨演講,分享了
    的頭像 發(fā)表于 04-03 15:02 ?2115次閱讀

    格科GC7272榮獲第八屆“IC創(chuàng)新獎(jiǎng)”成果產(chǎn)業(yè)化獎(jiǎng)

    近日,中國(guó)集成電路創(chuàng)新聯(lián)盟正式公布第八屆“IC創(chuàng)新獎(jiǎng)”獲獎(jiǎng)名單。格科GalaxyCore自主研發(fā)的觸控顯示驅(qū)動(dòng)集成芯片(TDDI)GC7272憑借超1億顆出貨規(guī)模及自主技術(shù)產(chǎn)業(yè)化成果,榮膺“成果產(chǎn)業(yè)化獎(jiǎng)”。這一獎(jiǎng)項(xiàng)不僅是對(duì)格科
    的頭像 發(fā)表于 03-25 16:55 ?1017次閱讀

    基于WTVxxx語(yǔ)音芯片的智能清潔機(jī)器人語(yǔ)音交互系統(tǒng)設(shè)計(jì)方案介紹

    集成、低功耗、多控制模式及傳感器擴(kuò)展能力,為智能清潔機(jī)器人提供了高效的語(yǔ)音交互解決方案。核心需求分析:1、實(shí)時(shí)狀態(tài)反饋:工作模式切換、電量提醒、故障報(bào)警等
    的頭像 發(fā)表于 03-06 08:27 ?762次閱讀
    基于WTVxxx<b class='flag-5'>語(yǔ)音</b>芯片的<b class='flag-5'>智能</b>清潔機(jī)器人<b class='flag-5'>語(yǔ)音</b><b class='flag-5'>交互</b>系統(tǒng)設(shè)計(jì)方案介紹