chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

你知道屏幕后是誰在和你對話嗎?新研究開發(fā)仿真面對面對話系統(tǒng)

Hf1h_BigDataDig ? 來源:TW ? 2019-09-02 15:48 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

基于深度神經(jīng)網(wǎng)絡(luò)仿真面對面對話系統(tǒng)

近日,CloudMinds和北京航空航天大學(xué)的研究人員基于深度學(xué)習(xí)提出了一種新的仿真面對面對話系統(tǒng)。CloudMinds是一家在機(jī)器人和云服務(wù)領(lǐng)域的領(lǐng)軍企業(yè),致力于成為針對各種機(jī)器人模型需求的供應(yīng)商。

該會(huì)話系統(tǒng)包括用于收聽和說話的兩個(gè)序列到序列模型以及基于虛擬代理合成器的生成性對抗網(wǎng)絡(luò)(GAN)模型。

當(dāng)虛擬代理與人通信時(shí),語音音頻和面部圖像被輸入到系統(tǒng)中。面部圖像由面部解析模塊處理,產(chǎn)生面部動(dòng)作和姿勢。然后將生成的信息傳遞到基于序列到序列的收聽模型中。當(dāng)虛擬代理在收聽時(shí),輸出被饋送到合成器中以產(chǎn)生逼真的面部圖像作為非語言反應(yīng)。

語音識(shí)別模型將語音音頻變換為文本,然后傳遞到會(huì)話模塊中以生成響應(yīng)語句,該響應(yīng)語句被傳遞到文本到語音(TTS)模塊以合成語音。響應(yīng)語句被傳遞到序列到序列的說話模型,其輸出也被輸入到虛擬合成器中以產(chǎn)生逼真的面部圖像,從而呼應(yīng)語音內(nèi)容。頭像合成器則用于在整個(gè)對話期間收聽和說話。

本文顯著改進(jìn)了傳統(tǒng)的基于3D模型的成果。為了訓(xùn)練模型,研究人員收集了大約700個(gè)ESPN視頻,其中包含來自YouTube的面對面對話場景。

與傳統(tǒng)3D模型的生成結(jié)果相比,該模型所生成的面部圖像更接近現(xiàn)實(shí)。毋庸置疑的是,在使得會(huì)話更加逼真自然的領(lǐng)域上,該系統(tǒng)還有很大的潛力可供挖掘,未來它還可用于實(shí)現(xiàn)個(gè)性化表情會(huì)話。

原文:

https://arxiv.org/abs/1908.07750

使用DISCo方法改進(jìn)鈣成像分析

本文中,德國海德堡大學(xué)跨學(xué)科科學(xué)計(jì)算中心(IWR)的研究人員介紹了DISCo方法,這是一種使用深度學(xué)習(xí),實(shí)例分割和相關(guān)性研究的新方法,可用于鈣成像分析中的細(xì)胞分割步驟。

DISCo將深度學(xué)習(xí)網(wǎng)絡(luò)的優(yōu)勢與最先進(jìn)的實(shí)例分割程序相結(jié)合,允許直接提取單元實(shí)例而無需任何復(fù)雜的后處理步驟。他們還以非常有效的方式利用鈣成像視頻的時(shí)間背景來計(jì)算像素之間的分段相關(guān)性。然后以摘要圖像的形式將此時(shí)間信息與基于形狀的信息相結(jié)合。

DISCo的最大優(yōu)勢在于能夠結(jié)合相關(guān)性和圖像特征,而不只依賴于其中一種方法。因此,DISCo可以通過在Neurofinder數(shù)據(jù)集上僅使用單個(gè)模型來使神經(jīng)研究人員獲得良好的整體性能。此外,當(dāng)在幾個(gè)數(shù)據(jù)集系列上訓(xùn)練單個(gè)網(wǎng)絡(luò)時(shí),研究人員能夠超越在Neurofinder數(shù)據(jù)集上訓(xùn)練的所有其他方法。

原文:

https://arxiv.org/abs/1908.07957

用于科研教育的低成本開源機(jī)器人賽車平臺(tái)

華盛頓大學(xué)保羅G.艾倫計(jì)算機(jī)科學(xué)與工程學(xué)院的研究人員最近介紹了MuSHR,即多代理的非完整賽車系統(tǒng)。MuSHR是一個(gè)低成本、開源的機(jī)器人賽車平臺(tái),致力于教育和研究,由MuSHR的個(gè)人機(jī)器人實(shí)驗(yàn)室開發(fā),旨在促進(jìn)機(jī)器人領(lǐng)域的公民化。作為一個(gè)低成本的平臺(tái),參與者可以通過說明,開源文檔和動(dòng)手教程參與其中。

賽車的硬件設(shè)計(jì)基于一系列現(xiàn)成的組件,這些組件可以從世界各地的線上和線下硬件商店中輕松地找到,而軟件架構(gòu)則是在個(gè)人機(jī)器人實(shí)驗(yàn)室中開發(fā)的。該平臺(tái)為華盛頓大學(xué)的移動(dòng)機(jī)器人課程開發(fā)了一套演示系統(tǒng)和許多寶貴的實(shí)踐經(jīng)驗(yàn),是機(jī)器人平臺(tái)開發(fā)的里程碑。

MuSHR的低成本開發(fā)模式和綜合的文檔記錄是寶貴的機(jī)器人研究資源。該平臺(tái)向?qū)W術(shù)研究實(shí)驗(yàn)室,機(jī)器人研究者及機(jī)器人愛好者等展示各種機(jī)器人研究項(xiàng)目提供了一個(gè)出色的測試平臺(tái)。

MuSHR具有開源指令和教程帶領(lǐng)用戶完成硬件開發(fā)。文檔托管在Github上,免費(fèi)供一般公眾下載使用。

代碼:

https://github.com/prl-mushr

原文:

https://arxiv.org/abs/1908.08031

三維掃描與CAD對象的聯(lián)合嵌入

近日,慕尼黑工業(yè)大學(xué)、斯坦福大學(xué)以及 Facebook 人工智能研究所共同提出了一種學(xué)習(xí)三維掃描和CAD之間的聯(lián)合嵌入空間的技術(shù)。而在這兩者中有很多聯(lián)系緊密且十分相似的事物。這一學(xué)習(xí)方法基于一種全新的3D CNN 技術(shù),通過學(xué)習(xí)聯(lián)合嵌入空間中事物的相似性來實(shí)現(xiàn)嵌入。

為了學(xué)習(xí)一個(gè)掃描對象和CAD模型可以相互交織的共享空間,研究人員提出使用堆疊沙漏的方式將前景、背景與掃描對象分開,并將其轉(zhuǎn)換為完整的類CAD表示,以此將它整合到共享嵌入空間中。這樣操作得到的嵌入空間可以用于CAD模型檢索。為了更好地完成這一任務(wù),研究人員引入了一個(gè)全新數(shù)據(jù)集,其中包括了掃描CAD相似性注釋。在這一數(shù)據(jù)集的幫助下,他們能夠?qū)AD模型檢索進(jìn)行細(xì)粒度的評估,并對雜亂、嘈雜部分進(jìn)行掃描。

這一新型學(xué)習(xí)方式比現(xiàn)有的CAD模型在實(shí)例檢索上的準(zhǔn)確率高出10% 以上。

因此,它在CAD模型檢索方面的表現(xiàn)比原有模型更好。學(xué)習(xí)這樣的聯(lián)合掃描- CAD嵌入空間不僅為CAD模型檢索提供了新的解決方案,也為這兩個(gè)領(lǐng)域之間的知識(shí)映射提供了新的可能性。

當(dāng)然,雖然這個(gè)技術(shù)在掃描與學(xué)習(xí)CAD對象空間方面非常有效,但它仍然有很多局限性——目前研究人員僅考慮了掃描和CAD對象領(lǐng)域中對象的幾何形狀;而這篇論文中未提及的顏色信息可能是聯(lián)合嵌入或CAD模型檢索的另一強(qiáng)大信號(hào)。

原文:

https://arxiv.org/abs/1908.06989

Google發(fā)布Turbo,可視化工具的里程碑式突破

Turbo 是由Google研究人員提出的一種著色工具,它既有Jet的優(yōu)勢功能,同時(shí)也解決了Jet的一些短板,例如細(xì)節(jié)錯(cuò)誤、條帶、和顏色混淆等。

在開發(fā)人員的精心調(diào)試下,Turbo的強(qiáng)大性能能夠勝任各種可視化任務(wù)。在開發(fā)過程中,研究人員們制作了一個(gè)簡單的交互界面,在其中他們能夠使用7節(jié)立方條來調(diào)整RGB曲線,同時(shí)將樣本結(jié)果與其他知名彩繪程序的結(jié)果進(jìn)行比較。

Turbo可以作為順序和發(fā)散的可視化工具,因此它很適合開發(fā)人員保存在自己的“工具箱”中。它用于解決均勻性不那么重要的數(shù)據(jù)可視化任務(wù)非常有效,尤其是在需要展現(xiàn)強(qiáng)烈對比的情況下。

Google的團(tuán)隊(duì)將這個(gè)工具用于實(shí)現(xiàn)視差貼圖、誤差貼圖以及許多其他標(biāo)量的可視化中。您可以在下方鏈接中找到在Python和C/C++ 中的使用這幾技術(shù)的方法,以及多項(xiàng)式逼近的方法——用于可能查表查詢不太方便的情況中。

Python:

https://gist.github.com/mikhailov-work/ee72ba4191942acecc03fe6da94fc73f

C/C++:

https://gist.github.com/mikhailov-work/6a308c20e494d9e0ccc29036b28faa7a

Polynomial approximation:

https://gist.github.com/mikhailov-work/0d177465a8151eb6ede1768d51d476c7

原文:

https://ai.googleblog.com/2019/08/turbo-improved-rainbow-colormap-for.html

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報(bào)投訴
  • 神經(jīng)網(wǎng)絡(luò)

    關(guān)注

    42

    文章

    4829

    瀏覽量

    106828
  • AI
    AI
    +關(guān)注

    關(guān)注

    90

    文章

    38189

    瀏覽量

    297024

原文標(biāo)題:狗還是機(jī)器人?誰在屏幕后和你對話?新研究開發(fā)仿真面對面對話系統(tǒng) | 一周AI最火論文

文章出處:【微信號(hào):BigDataDigest,微信公眾號(hào):大數(shù)據(jù)文摘】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點(diǎn)推薦

    AI教父Hinton對話云天勵(lì)飛陳寧

    ,圍繞算力效率、AI 向善與普惠未來展開了一場高密度對話對話由硅谷著名計(jì)算機(jī)科學(xué)家、硅谷高創(chuàng)會(huì)大會(huì)主席吳軍博士主持。
    的頭像 發(fā)表于 12-03 14:04 ?363次閱讀

    思必馳任務(wù)型對話算法通過國家備案

    近日,國家網(wǎng)信辦公開發(fā)布第十四批境內(nèi)深度合成服務(wù)算法備案信息,思必馳任務(wù)型對話算法正式通過備案。這是思必馳第八項(xiàng)通過備案的算法,進(jìn)一步鞏固了在對話式人工智能領(lǐng)域的技術(shù)與合規(guī)優(yōu)勢。
    的頭像 發(fā)表于 11-20 10:33 ?601次閱讀

    2025年RT-Thread開發(fā)者巡回培訓(xùn)報(bào)名正式啟動(dòng)!

    與RT-Thread技術(shù)專家面對面答疑解惑的絕佳機(jī)會(huì)。在這里將體驗(yàn)豐富的理論課程、精彩Demo演示與動(dòng)手實(shí)踐!歡迎報(bào)名參加,與我們攜手探索技術(shù)的更多可能!日期城市10月
    的頭像 發(fā)表于 09-27 10:39 ?1158次閱讀
    2025年RT-Thread<b class='flag-5'>開發(fā)</b>者巡回培訓(xùn)報(bào)名正式啟動(dòng)!

    system view 不能recorder是怎么回事?

    點(diǎn)擊recorder按鈕彈出下面對話框,不曉得配置問題還是操作問題
    發(fā)表于 09-22 06:02

    與作者面對面丨英飛凌IPAC直播間即將亮相PCIM Asia 2025

    PCIMAsia展會(huì)現(xiàn)場!直播主題:與作者面對面,深度解讀2025PCIMAsia論文直播時(shí)間:2025年9月24日1500掃碼立即報(bào)名將可以看到英飛凌資深“攻城獅
    的頭像 發(fā)表于 09-16 17:06 ?1029次閱讀
    與作者<b class='flag-5'>面對面</b>丨英飛凌IPAC直播間即將亮相PCIM Asia 2025

    【應(yīng)用方案】“會(huì)呼吸”的洗衣機(jī):艾為燈語?讓光與對話

    是否想過,洗衣機(jī)會(huì)用光的語言與您對話?當(dāng)科技被賦予溫度,最日常的洗衣時(shí)刻也開始有了詩意。艾為燈語助力智能家電系列,讓洗衣機(jī)從冰冷的金屬外殼中蘇醒,用光的語言與溫柔對話。這不是一次簡
    的頭像 發(fā)表于 09-11 18:56 ?529次閱讀
    【應(yīng)用方案】“會(huì)呼吸”的洗衣機(jī):艾為燈語?讓光與<b class='flag-5'>你</b>“<b class='flag-5'>對話</b>”

    米爾RK3576部署端側(cè)多模態(tài)多輪對話,6TOPS算力驅(qū)動(dòng)30億參數(shù)LLM

    ]。 RK3576 工作狀態(tài) 本文目錄 本文目錄 一、引言 1.1 什么是多輪對話? 1.2 多輪對話系統(tǒng)鳥瞰:三顆“核心”協(xié)同驅(qū)動(dòng) 1.3 核心邏輯:多輪對話的處理流程 二、工程化
    發(fā)表于 09-05 17:25

    廣和通發(fā)布自研端側(cè)語音識(shí)別大模型FiboASR

    7月,全球領(lǐng)先的無線通信模組及AI解決方案提供商廣和通,發(fā)布其自主研發(fā)的語音識(shí)別大模型FiboASR。該模型專為端側(cè)設(shè)備上面臨的面對面實(shí)時(shí)對話及多人會(huì)議場景深度優(yōu)化,在低延遲語音交互、實(shí)時(shí)語音轉(zhuǎn)錄
    的頭像 發(fā)表于 08-04 11:43 ?1381次閱讀

    直播預(yù)告|與往屆紫光同創(chuàng)國一選手面對面交流參賽經(jīng)驗(yàn)

    再說一遍:2025年3月17日周一晚1900B站UP主“小眼睛半導(dǎo)體”直播間與2024集創(chuàng)賽紫光同創(chuàng)杯國一選手面對面交流參賽及獲獎(jiǎng)經(jīng)驗(yàn)哦有任何疑問聯(lián)系微信客服:17665247134原文標(biāo)題:直播
    的頭像 發(fā)表于 04-14 09:53 ?351次閱讀
    直播預(yù)告|與往屆紫光同創(chuàng)國一選手<b class='flag-5'>面對面</b>交流參賽經(jīng)驗(yàn)

    單次、多次對話與RTC對話AI交互模式,如何各顯神通?

    在這個(gè)充滿無限可能的AI時(shí)代,這些奇妙場景正逐步走進(jìn)我們的生活。可曾想象過,有一天家里的智能設(shè)備會(huì)化身相聲演員,和你幽默對答?或者,的玩具能像知心好友一樣,陪你暢聊心事?單次對話、
    的頭像 發(fā)表于 04-02 18:18 ?1946次閱讀
    單次、多次<b class='flag-5'>對話</b>與RTC<b class='flag-5'>對話</b>AI交互模式,如何各顯神通?

    能和Ai-M61模組對話了?手搓一個(gè)ChatGPT 語音助手

    起猛了, 安信可的Ai-M61模組能說話了! 超低延遲實(shí)時(shí)秒回 ,對話超絲滑的那種,先來看一段VCR: 小安派+ChatGPT語音實(shí)測:對話絲滑到忘記對面是AI_ 人工智能的應(yīng)用日益廣泛。 各家模型
    的頭像 發(fā)表于 03-12 11:57 ?1w次閱讀
    能和Ai-M61模組<b class='flag-5'>對話</b>了?手搓一個(gè)ChatGPT 語音助手

    摩爾線程Round Attention優(yōu)化AI對話

    摩爾線程科研團(tuán)隊(duì)發(fā)布研究成果《Round Attention:以輪次塊稀疏性開辟多輪對話優(yōu)化新范式》,該方法端到端延遲低于現(xiàn)在主流的Flash Attention推理引擎,kv-cache 顯存占用節(jié)省55%到82% 。
    的頭像 發(fā)表于 03-06 09:39 ?902次閱讀
    摩爾線程Round Attention優(yōu)化AI<b class='flag-5'>對話</b>

    HarmonyOS NEXT 原生應(yīng)用開發(fā):社交聊天對話過程實(shí)現(xiàn)

    一、實(shí)現(xiàn)思路 本DEMO旨在展示如何在HarmonyOS NEXT平臺(tái)上,利用ArkTS開發(fā)語言構(gòu)建一個(gè)簡易的社交聊天對話界面。用戶可以在此界面上查看聊天記錄,并發(fā)送新的消息。此示例中,聊天記錄
    發(fā)表于 01-07 10:55

    HarmonyOS NEXT 應(yīng)用開發(fā)練習(xí):AI智能對話

    一、練習(xí)內(nèi)容 在這個(gè)HarmonyOS NEXT原生應(yīng)用DEMO中,我們將使用ArkTS開發(fā)語言創(chuàng)建一個(gè)功能更為豐富的AI智能對話框。這個(gè)對話框不僅具備基本的聊天功能,還能展示圖片消息、表情符號(hào),并
    發(fā)表于 01-03 11:29

    TIKOOL太酷信息無線內(nèi)部通話系統(tǒng)允許多個(gè)人一起講話,頻道內(nèi)會(huì)不會(huì)很吵?

    傳統(tǒng)的對講機(jī)聲音采樣率普遍是4K,音質(zhì)差,往往音量大但稍有干擾就聽不清內(nèi)容;TIKOOL太酷無線內(nèi)部通話系統(tǒng)音頻采樣率可達(dá)16K,音質(zhì)數(shù)倍的提升,具備極高的聲音還原度,如同面對面聊天,多人講話也不會(huì)
    發(fā)表于 12-18 09:07