chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

探究對深度學習模型VAE的時序性解耦

電子工程師 ? 來源:DeepBlue深蘭科技 ? 作者:DeepBlue深蘭科技 ? 2021-06-04 11:10 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

現(xiàn)代深度學習架構一直被描述為一個黑匣子:被輸入數(shù)據(jù),并期望從中得到一些結果。然而,由于此類架構存在許多的復雜性,過程中發(fā)生的事情,通常難以解釋和分析。這已發(fā)展成為整個社會未能廣泛接受深度學習的主要原因之一,尤其是對于關鍵任務應用程序。

因此,“黑匣子”的解體已成為機器學習研究人員的一個重大開放問題,并且是該領域當前感興趣的問題之一,這一研究領域通常被稱為機器學習架構的“可解釋性”。在本文中,我們將討論可解釋性研究中的一個重要主題,即解耦問題。

Disentangled

Sequential VAE

光的解耦(Ddisentangled)

我們舉個常見的例子:在日常生活中,太陽光看起來是白色的,但是如果我們讓陽光通過三棱鏡,就會發(fā)現(xiàn)陽光分別折射出多種色彩。這說明白光其實是多種顏色混合的體現(xiàn),而我們可以通過三棱鏡把它分解成基本七種顏色,其中包括紅、綠、藍三原色。

我們繼續(xù)聊聊白光:在廣泛意義上說光是由RGB三種顏色組成的。這也就定義了光的解耦過程:光可以分離成R、G、B三種顏色,同時我們也可以用這三種顏色,進行不同程度的疊加,產生豐富而廣泛的顏色。

計算機定義顏色時R、G、 B三種成分的取值范圍是0-255,0表示沒有刺激量,255表示刺激量達最大值。R、G、B均為255時就合成了白光,R、G、B均為0時就形成了黑色。在這個區(qū)間范圍內,我們可以通過任意的數(shù)值組合構造出無數(shù)種不同的顏色,讓我們的生活充滿色彩。

白光和解耦又有什么關系呢?那關系就大了!我們下面簡單聊一下一種深度學習模型——變分自編碼器模型(VAE:variational autoencoder),然后用它來解釋解耦。

什么是VAE?

什么是VAE呢?那要先從AE開始說起了。

AE(Autoencoder)

87c81b48-c4e0-11eb-9e57-12bb97331649.png

上圖由兩個部分組成,第一個部分是編碼器(Encoder),第二部分是解碼器(Decoder),圖片經過編碼器得到一個潛在的編碼(code),編碼再通過解碼器還原輸入的圖片,因此得到的編碼就是圖片在一個潛在空間的表示。而編碼器和解碼器就是由神經網(wǎng)絡組成的。圖中例子就是希望能夠生成一張一樣的圖片。

VAE (Variational Autoencoder)

變分編碼器是自動編碼器的升級版本,其結構跟自動編碼器相似,也由編碼器和解碼器構成。在AE中,輸入一個圖片得到一個的編碼(code),但這個編碼是一個固定的編碼,使得模型沒有很好的泛化功能。所以VAE引入了一種新的方式有效解決了上述的問題,就是將編碼問題變成一個分布問題,具體操作是在AE的基礎上增加一個限制,迫使編碼器得到的編碼(code)能夠粗略地遵循一個標準正態(tài)分布,這就是其與一般的自動編碼器最大的不同。

這樣我們生成一張新圖片就很簡單了,我們只需要給它一個標準正態(tài)分布的隨機隱含向量,這樣通過解碼器就能夠生成我們想要的圖片,而不需要給它一張原始圖片先進行編碼。

87d5973c-c4e0-11eb-9e57-12bb97331649.png

VAE的演變增加了模型的泛化性,以上圖VAE的過程為例,當輸入的圖片是貓時,通過貓的特征來生成新的圖片,VAE的好處就在于當輸入的圖片不是完整的圖片時(訓練集外),它依舊可以還原成原來的樣子。

在深度學習中,不管是什么樣的模型,數(shù)據(jù)都很重要,而VAE的好處就在于 :

它可以通過編碼和解碼的過程,通過抽樣,生成新的數(shù)據(jù)。這樣對于機器學習就有了更多的數(shù)據(jù)支撐從而得到更好的模型效果。

VAE在中間層會得到一個編碼(code),也就是一個語義層,我們可以通過對于這個語義的理解,從而達到圖片的分類、變換的效果。

如果我們類比光的解耦(將光分離成R、G、B三種顏色),VAE(Variational Autoencoder)就可以理解成是深度學習框架的三棱鏡。

這是為什么呢?我們先給一個淺顯的技術介紹,然后再回來聊顏色分離。

VAE是一種深度學習框架,更具體來說,它是一種生成模型。生成模型的操作很簡單:它可以讀取數(shù)據(jù)(多為圖片),抽取數(shù)據(jù)的特征,然后自動生成有這些特征的新數(shù)據(jù)。我們這里關心的是提取特征這個環(huán)節(jié)。大多生成模型的特征提取模式,便是經過所謂的“潛在變量”(latent variables)來編碼提取到的特征。

這里的一個明顯的問題便是:我們怎么判斷正式數(shù)據(jù)里的某一個特征對應的是哪個語義變量?我們可以回到類比成顏色分離和生成的過程,將一種顏色先編碼(encoder)成R,G,B,再通過解碼(decoder)形成一種顏色。

Disentangled Sequential VAE

隨著對VAE的研究,越來越多的研究重點就放在了如何在VAE的基礎上做到disentangled的過程。以下簡單介紹一下深蘭科學院對于該項目的研究內容:對于時序的數(shù)據(jù)解耦出其數(shù)據(jù)的動態(tài)信息和靜態(tài)信息,并理解靜態(tài)信息和動態(tài)信息的語義,后續(xù)團隊的目標也是基于當前的項目,進行這個主流方向的基礎研究。

本項目采用的數(shù)據(jù)是Sprites,這是個具有時序性的數(shù)據(jù)。小精靈有著不同的顏色和動作,團隊的任務就是通過這些小精靈的圖片,解耦出小精靈的動態(tài)信息(小精靈的動作)和靜態(tài)信息(小精靈的顏色)。通過深度學習來獲得小精靈動靜態(tài)信息的語義,并理解這語義從而生成新的小精靈。

如下圖所示,通過深度學習得到小精靈的動態(tài)信息和靜態(tài)信息,并改變他們的值的生成效果(上排是原始數(shù)據(jù),下排是生成數(shù)據(jù))。

1. 改變靜態(tài)信息(顏色)

2.改變動態(tài)信息

對于VAE時序性解耦的工作可以更容易地說明神經網(wǎng)絡的可解釋性,這樣的任務不僅可以對神經網(wǎng)絡的基礎研究作出貢獻,還可以應用到很多人工智能的項目中,例如對圖像視頻的處理;動靜的解耦可以實現(xiàn)換臉等效果;在自然語言處理中,可以改變聲音的種類等。

編輯:jq

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權轉載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 解碼器
    +關注

    關注

    9

    文章

    1202

    瀏覽量

    42842
  • 數(shù)據(jù)

    關注

    8

    文章

    7314

    瀏覽量

    93920
  • 計算機
    +關注

    關注

    19

    文章

    7763

    瀏覽量

    92656
  • Code
    +關注

    關注

    0

    文章

    71

    瀏覽量

    16149
  • 深度學習
    +關注

    關注

    73

    文章

    5589

    瀏覽量

    123884

原文標題:探究 | 對深度學習模型VAE的時序性解耦

文章出處:【微信號:kmdian,微信公眾號:深蘭科技】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    自動駕駛中Transformer大模型會取代深度學習嗎?

    [首發(fā)于智駕最前沿微信公眾號]近年來,隨著ChatGPT、Claude、文心一言等大語言模型在生成文本、對話交互等領域的驚艷表現(xiàn),“Transformer架構是否正在取代傳統(tǒng)深度學習”這一話題一直被
    的頭像 發(fā)表于 08-13 09:15 ?3897次閱讀
    自動駕駛中Transformer大<b class='flag-5'>模型</b>會取代<b class='flag-5'>深度</b><b class='flag-5'>學習</b>嗎?

    蘭州大學:研究阻抗實現(xiàn)高精度自供能多模傳感

    近日,蘭州大學材料與能源學院研究團隊提出阻抗策略用于提高自供能傳感系統(tǒng)中的傳感精度,實現(xiàn)高精度多模態(tài)傳感。 隨著物聯(lián)網(wǎng)和5G技術的飛速發(fā)展,利用環(huán)境能量供電的自供能傳感技術愈發(fā)重要。但是,由于
    的頭像 發(fā)表于 07-23 11:26 ?1028次閱讀
    蘭州大學:研究阻抗<b class='flag-5'>解</b><b class='flag-5'>耦</b>實現(xiàn)高精度自供能多模傳感

    無軸承異步電機氣隙磁場定向逆控制

    軸承異步電機進行動態(tài)控制。經解后的徑向位移子系統(tǒng)只與懸浮繞組電流和轉矩系統(tǒng)氣隙磁鏈有關,耦合變量減少;而且逆系統(tǒng)模型中不再有負載轉矩變量,更便于逆系統(tǒng)的實現(xiàn)。 純分享帖,點擊下方
    發(fā)表于 07-14 17:43

    無軸承異步電機的RFOC逆動態(tài)控制

    進行了轉速和轉子磁鏈之間、兩個徑向位移分量之間的動態(tài)控制方法研究,給出了逆動態(tài)控制系統(tǒng)結構。仿真結果表明,系統(tǒng)各狀態(tài)變量之間實現(xiàn)了可靠的動態(tài)
    發(fā)表于 07-14 17:35

    模型推理顯存和計算量估計方法研究

    GPU、FPGA等硬件加速。通過分析硬件加速器的性能參數(shù),可以估算模型在硬件加速下的計算量。 四、實驗與分析 為了驗證上述估計方法的有效,我們選取了幾個具有代表深度
    發(fā)表于 07-03 19:43

    軟硬+模塊化:深度拆解開放架構的“自由”基因

    ET2500系列應運而生——這款基于開放架構的智能業(yè)務處理平臺,通過算網(wǎng)融合芯片與模塊化設計,實現(xiàn)軟硬件,將網(wǎng)絡、路由、安全等功能集成于單一設備,為中小企業(yè)提供高性能、易維護的一體化解決方案
    的頭像 發(fā)表于 06-09 15:42 ?896次閱讀
    軟硬<b class='flag-5'>解</b><b class='flag-5'>耦</b>+模塊化:<b class='flag-5'>深度</b>拆解開放架構的“自由”基因

    模型時代的深度學習框架

    作者:算力魔方創(chuàng)始人/英特爾創(chuàng)新大使劉力 在 CNN時代 ,AI模型的參數(shù)規(guī)模都在百萬級別,僅需在單張消費類顯卡上即可完成訓練。例如,以業(yè)界知名的CNN模型: ResNet50 為例,模型參數(shù)
    的頭像 發(fā)表于 04-25 11:43 ?640次閱讀
    大<b class='flag-5'>模型</b>時代的<b class='flag-5'>深度</b><b class='flag-5'>學習</b>框架

    永磁同步電機電流環(huán)改進內模控制的研究

    取,因此控制效果難以達到最佳 。依據(jù)自由度原理,在保證內模效果的基礎上,引入 2 個內模電流調 節(jié)因子,對內模控制器進行改進 。仿真結果表明,改進算法的魯棒
    發(fā)表于 03-26 14:25

    在OpenVINO?工具套件的深度學習工作臺中無法導出INT8模型怎么解決?

    無法在 OpenVINO? 工具套件的深度學習 (DL) 工作臺中導出 INT8 模型
    發(fā)表于 03-06 07:54

    如何優(yōu)化BP神經網(wǎng)絡的學習

    優(yōu)化BP神經網(wǎng)絡的學習率是提高模型訓練效率和性能的關鍵步驟。以下是一些優(yōu)化BP神經網(wǎng)絡學習率的方法: 一、理解學習率的重要
    的頭像 發(fā)表于 02-12 15:51 ?1405次閱讀

    小白學解釋AI:從機器學習到大模型

    科學AI需要可解釋人工智能的崛起,尤其是深度學習的發(fā)展,在眾多領域帶來了令人矚目的進步。然而,伴隨這些進步而來的是一個關鍵問題——“黑箱”問題。許多人工智能模型,特別是復雜的
    的頭像 發(fā)表于 02-10 12:12 ?1138次閱讀
    小白學解釋<b class='flag-5'>性</b>AI:從機器<b class='flag-5'>學習</b>到大<b class='flag-5'>模型</b>

    【「基于大模型的RAG應用開發(fā)與優(yōu)化」閱讀體驗】+大模型微調技術解讀

    今天學習<基于大模型的RAG應用開發(fā)與優(yōu)化>這本書。大模型微調是深度學習領域中的一項關鍵技術,它指的是在已經預訓練好的大型
    發(fā)表于 01-14 16:51

    Flexus X 實例 ultralytics 模型 yolov10 深度學習 AI 部署與應用

    前言: ???深度學習新紀元,828 B2B 企業(yè)節(jié) Flexus X 實例特惠!想要高效訓練 YOLOv10 模型,實現(xiàn)精準圖像識別?Flexus X 以卓越算力,助您輕松駕馭大規(guī)模數(shù)據(jù)集,加速
    的頭像 發(fā)表于 12-24 12:24 ?1280次閱讀
    Flexus X 實例 ultralytics <b class='flag-5'>模型</b> yolov10 <b class='flag-5'>深度</b><b class='flag-5'>學習</b> AI 部署與應用

    瑞薩電子與吉利汽車聯(lián)合舉辦汽車主控芯片軟硬能力提升訓練營

    近日,由瑞薩電子與吉利汽車研究院聯(lián)合舉辦的“汽車主控芯片軟硬能力提升訓練營”順利落幕。
    的頭像 發(fā)表于 12-09 10:50 ?1096次閱讀