chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

3D UX-Net:超強(qiáng)的醫(yī)學(xué)圖像分割新網(wǎng)絡(luò)

CVer ? 來(lái)源:CVHub ? 2023-02-01 15:57 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

2a2a3e3c-a187-11ed-bfe3-dac502259ad0.png

Title: 3D UX-Net: a Large Kernel Volumetric ConvNet Modernizing Hierarchical Transformer for Medical Image Segmentation

Author: Ho Hin Lee et al. (范德堡大學(xué))

Paper: https://arxiv.org/abs/2209.15076

Github: https://github.com/MASILab/3DUX-Net

引言

眾所周知,大多數(shù)醫(yī)學(xué)圖像如 MRI 和 CT 是屬于 volumetric data 類型。因此,為了更加充分的利用體素信息,近幾年已經(jīng)提出了不少 3D CNNs 的模型,如 SwinUNETRUNETR以及筆者前段時(shí)間分享過(guò)的UNETR++等。

整體來(lái)說(shuō),這些模型性能是越來(lái)越高,在幾個(gè)主流的 3D 數(shù)據(jù)基準(zhǔn)測(cè)試中也實(shí)現(xiàn)了大大小小的 SOTA,特別是 3D 醫(yī)學(xué)圖像分割這塊。當(dāng)然,時(shí)代在進(jìn)步,作為一名高科技前沿從業(yè)者本身也是需要不斷汲取新的知識(shí)營(yíng)養(yǎng)才能不被輕易的淘汰。今天小編就帶大家解讀下 ICLR 2023 新鮮出爐的 3D 醫(yī)學(xué)圖像分割之星——3D UX-Net。

3D UXNet 是一種輕量級(jí)3D卷積神經(jīng)網(wǎng)絡(luò),其使用 ConvNet 模塊調(diào)整分層 Transformer 以實(shí)現(xiàn)穩(wěn)健的體素分割,在三個(gè)具有挑戰(zhàn)性的腦體積和腹部成像公共數(shù)據(jù)集與當(dāng)前的 SOTA 模型如 SwinUNETR 對(duì)比,同時(shí)在以下三大主流數(shù)據(jù)集性能均達(dá)到了最優(yōu):

  • MICCAI Challenge 2021 FLARE
  • MICCAI Challenge 2021 FeTA
  • MICCAI Challenge 2022 AMOS

具體的,相比于 SwinUNETR,3D UX-Net 將 Dice 從 0.929 提高到 0.938 (FLARE2021),Dice 從 0.867 提高到 0.874 (Feta2021)。此外,為了進(jìn)一步評(píng)估 3D UX-Net 的遷移學(xué)習(xí)能力,作者在 AMOS2022 數(shù)據(jù)集上訓(xùn)練得到的模型在另一個(gè)數(shù)據(jù)集上取得了 2.27% Dice 的提升(0.880 → 0.900)。

動(dòng)機(jī)

先來(lái)看看最近提出的一眾基于 Transformer 架構(gòu)的 ViT 模型有什么優(yōu)劣勢(shì)。以 SwinUNETR 為例,其將 ConvNet 的一些先驗(yàn)引入到了 Swin Transformer 分層架構(gòu)中,進(jìn)一步增強(qiáng)了在 3D 醫(yī)學(xué)數(shù)據(jù)集中調(diào)整體素分割的實(shí)際可行性。此類 "Conv+Transforemr" 的組合拳的有效性在很大程度上歸功于以下兩個(gè)因素:

  • 非局部自注意力所帶來(lái)的大感受野
  • 大量的模型參數(shù)

為此,本文作者想到了應(yīng)用深度卷積以更少的模型參數(shù)來(lái)模擬這些方法讓網(wǎng)絡(luò)學(xué)會(huì)如何捕獲更大感受野的行為。這一點(diǎn)筆者在前文《關(guān)于語(yǔ)義分割的億點(diǎn)思考》中也提過(guò),文中對(duì)整個(gè)任務(wù)進(jìn)行了深度剖析,有興趣的讀者可以自行翻閱公眾號(hào)歷史文章:

語(yǔ)義分割任務(wù)的核心思想是如何高效建模上下文信息,它是提升語(yǔ)義分割性能最為重要的因素之一,而有效感受野則大致決定了網(wǎng)絡(luò)能夠利用到多少上下文信息。

回到正文,本文的設(shè)計(jì)思路主要是受 ConvNeXt 啟發(fā),還沒(méi)了解過(guò)的同學(xué)也可自行移動(dòng)到公眾號(hào)翻閱歷史文章,筆者之前對(duì)該系列也講解過(guò)了,此處不再詳述。3D UX-Net 核心理念是設(shè)計(jì)出一種簡(jiǎn)單、高效和輕量化的 網(wǎng)絡(luò),其適用于 hierarchical transformers 的能力同時(shí)保留使用 ConvNet 模塊的優(yōu)勢(shì),如歸納偏置。具體地,其編碼器模塊設(shè)計(jì)的基本思想可分為: 1) block-wise(微觀層面) 及 2) layer-wise(宏觀層面)【可以類比下 ConvNeXt】。

block-wise

首先,我們先從下列三個(gè)不同的視角進(jìn)行討論。

Patch-wise Features Projection

對(duì)比 ConvNets 和 ViTs 之間的相似性,兩個(gè)網(wǎng)絡(luò)都使用一個(gè)共同的基礎(chǔ)模塊將特征表示縮小到特定的尺寸。以往的方法大都沒(méi)有將圖像塊展平為具有線性層的順序輸入,因此作者采用具備大卷積核的投影層來(lái)提取 patch-wise 特征作為編碼器的輸入。

Volumetric Depth-wise Convolution with LKs

Swin transformer 的內(nèi)在特性之一是用于計(jì)算非局部 MSA 的滑動(dòng)窗口策略??偟膩?lái)說(shuō),有兩種分層方法來(lái)計(jì)算 MSA:基于窗口的 MSA (W-MSA) 和 移動(dòng)窗口 MSA (SW-MSA)。這兩種方式都生成了跨層的全局感受野,并進(jìn)一步細(xì)化了非重疊窗口之間的特征對(duì)應(yīng)關(guān)系。

受深度卷積思想的啟發(fā),作者發(fā)現(xiàn)自注意力中的加權(quán)和方法與每通道卷積基礎(chǔ)之間的相似之處,其認(rèn)為使用 LK 大小的深度卷積可以在提取類似于 MSA 塊的特征時(shí)提供大的感受野。因此,本文建議采用 LK 大?。ɡ?,從 7 × 7 × 7 開(kāi)始)通過(guò)深度卷積壓縮 Swin transformer 的窗口移動(dòng)特性。如此一來(lái)便可以保證每個(gè)卷積核通道與相應(yīng)的輸入通道進(jìn)行卷積運(yùn)算,使得輸出特征與輸入具備相同的通道維度。

Inverted Bottleneck with Depthwise Convolutional Scaling

Swin transformer 的另一個(gè)固有結(jié)構(gòu)是,它們被設(shè)計(jì)為 MLP 塊的隱藏層維度比輸入維度寬四倍,如下圖所示。有趣的是,這種設(shè)計(jì)與 ResNet 塊中的擴(kuò)張率相關(guān)。因此,我們利用 ResNet 塊中的類似設(shè)計(jì)并向上移動(dòng)深度卷積來(lái)計(jì)算特征。此外,通過(guò)引入了具有 1 × 1 × 1 卷積核大小的深度卷積縮放(DCS),以獨(dú)立地線性縮放每個(gè)通道特征。通過(guò)獨(dú)立擴(kuò)展和壓縮每個(gè)通道來(lái)豐富特征表示,可以最小化跨通道上下文產(chǎn)生的冗余信息,同時(shí)在每個(gè)階段增強(qiáng)了與下采樣塊的跨通道特征對(duì)應(yīng)。最后,通過(guò)使用 DCS,可以進(jìn)一步將模型復(fù)雜度降低 5%,并展示了與使用 MLP 模型的架構(gòu)相當(dāng)?shù)慕Y(jié)果。

2a35a11e-a187-11ed-bfe3-dac502259ad0.png

layer-wise

介紹完微觀層面的設(shè)計(jì)思想,再讓我們從宏觀層面出發(fā),以另外三個(gè)嶄新的視角去理解作者的動(dòng)機(jī)。

Applying Residual Connections

從上圖左上角可以看到,標(biāo)準(zhǔn)的 3D U-Net 模型內(nèi)嵌的模塊為 2 個(gè) 3 x 3 x 3 卷積的堆疊,其展示了使用小卷積核提取具有增加通道的局部表示的樸素方法;而其右手邊的 SegResNet 則應(yīng)用了類似 3D 版本的瓶頸層,先降維再升維最后再接殘差表示;緊接著左下角的便是 Swin Transformer,其基于窗口注意力+MLP層的組合;最后右下角便是本文所提出的模塊,其在最后一個(gè)縮放層之后應(yīng)用輸入和提取特征之間的殘差連接。此外,在殘差求和前后并沒(méi)有應(yīng)用到任何的歸一化層和激活層。

Adapting Layer Normalization

我們知道,在卷積神經(jīng)網(wǎng)絡(luò)中,BN 是一種常用策略,它對(duì)卷積表示進(jìn)行歸一化以增強(qiáng)收斂性并減少過(guò)擬合。然而,之前的工作已經(jīng)證明 BN 會(huì)對(duì)模型的泛化能力產(chǎn)生不利影響。因此作者這里跟 ConvNeXt 一致,將 BN 替換為 LN。

Using GELU as the Activation Layer

ReLU 是個(gè)好東西,幾乎是現(xiàn)代 CNNs 模型的首選激活函數(shù)。作者在這里提倡使用 GELU,這是一種基于高斯誤差的線性變換單元,相對(duì) ReLU 更加平滑,也是其中一種變體,解決 ReLU 因負(fù)梯度被硬截?cái)喽鴮?dǎo)致的神經(jīng)元失活問(wèn)題。

方法

2a3d3cc6-a187-11ed-bfe3-dac502259ad0.png

可以看出,整體的設(shè)計(jì)思路非常簡(jiǎn)潔,框架也是一目了然,就一個(gè)標(biāo)準(zhǔn)的 3D U-Net 架構(gòu),由編碼器-解碼器組成,同時(shí)結(jié)合長(zhǎng)跳躍連接操作幫助網(wǎng)絡(luò)更好的恢復(fù)空間細(xì)節(jié)的定位。也沒(méi)啥好分析的,下面就簡(jiǎn)單拆開(kāi)來(lái)看看,帶大家快速的過(guò)一遍就行。

DEPTH-WISE CONVOLUTION ENCODER

首先,輸入部分應(yīng)用一個(gè)大卷積核將原始圖像映射到一個(gè)低維空間分辨率的潛在空間特征表示,一來(lái)降低顯存參數(shù)量計(jì)算量等,二來(lái)可以增大網(wǎng)絡(luò)感受野,順便再處理成編碼器輸入所需的格式,總之好處多多,不過(guò)都是基操。

處理完之后就輸入到編碼器中進(jìn)行主要的特征提取,該編碼器共4個(gè)stage,也是標(biāo)準(zhǔn)的16倍下采樣。每個(gè)stage由多個(gè)不同的 3D UX-Net Block 構(gòu)成,具體長(zhǎng)啥樣自己看下左圖一點(diǎn)就通。主要的特點(diǎn)就是主打輕量化和大感受野。

DECODER

編碼器中每個(gè)階段的多尺度輸出通過(guò)長(zhǎng)跳躍連接鏈接到基于 ConvNet 的解碼器,并形成一個(gè)類似U形的網(wǎng)絡(luò)以用于下游的分割任務(wù)。這一塊就跟標(biāo)準(zhǔn)的 3D U-Net 幾乎沒(méi)啥兩樣了。

實(shí)驗(yàn)

消融實(shí)驗(yàn)

2a4968c0-a187-11ed-bfe3-dac502259ad0.png

可視化效果

2a517ac4-a187-11ed-bfe3-dac502259ad0.png

可以看到,與 GT 相比,3D UX-Net器官和組織的形態(tài)得到了很好的保存。

與 SOTA 方法的對(duì)比

2a5b742a-a187-11ed-bfe3-dac502259ad0.png

從上述表格可以看出,3D UX-Net 在所有分割任務(wù)中均展示出最佳性能,并且 Dice 分?jǐn)?shù)有了顯著提高(FeTA2021:0.870 到 0.874,F(xiàn)LARE2021:0.929 到 0.934)。

總結(jié)

本文為大家介紹了 3D UX-Net,這是第一個(gè)將分層 Transformer 的特征與用于醫(yī)學(xué)圖像分割的純 ConvNet 模塊相適應(yīng)的3D網(wǎng)絡(luò)架構(gòu)。具體地,本文重新設(shè)計(jì)了具有深度卷積的編碼器塊,以更低的代價(jià)實(shí)現(xiàn)與 Transformer 想媲美的能力。最后,通過(guò)在三個(gè)具有挑戰(zhàn)性的公共數(shù)據(jù)集上進(jìn)行的廣泛實(shí)驗(yàn)表明所提方法的高效性。

審核編輯 :李倩


聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴

原文標(biāo)題:ICLR 2023 | 3D UX-Net:超強(qiáng)的醫(yī)學(xué)圖像分割新網(wǎng)絡(luò)

文章出處:【微信號(hào):CVer,微信公眾號(hào):CVer】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    玩轉(zhuǎn) KiCad 3D模型的使用

    “ ?本文將帶您學(xué)習(xí)如何將 3D 模型與封裝關(guān)聯(lián)、文件嵌入,講解 3D 查看器中的光線追蹤,以及如何使用 CLI 生成 PCBA 的 3D 模型。? ” ? 在日常的 PCB 設(shè)計(jì)中,我們大部分
    的頭像 發(fā)表于 09-16 19:21 ?6232次閱讀
    玩轉(zhuǎn) KiCad <b class='flag-5'>3D</b>模型的使用

    iTOF技術(shù),多樣化的3D視覺(jué)應(yīng)用

    視覺(jué)傳感器對(duì)于機(jī)器信息獲取至關(guān)重要,正在從二維(2D)發(fā)展到三維(3D),在某些方面模仿并超越人類的視覺(jué)能力,從而推動(dòng)創(chuàng)新應(yīng)用。3D 視覺(jué)解決方案大致分為立體視覺(jué)、結(jié)構(gòu)光和飛行時(shí)間 (TOF) 技術(shù)
    發(fā)表于 09-05 07:24

    AD 3D封裝庫(kù)資料

    ?AD ?PCB 3D封裝
    發(fā)表于 08-27 16:24 ?2次下載

    3D打印能用哪些材質(zhì)?

    3D打印的材質(zhì)有哪些?不同材料決定了打印效果、強(qiáng)度、用途乃至安全性,本文將介紹目前主流的3D打印材質(zhì),幫助你找到最適合自己需求的材料。
    的頭像 發(fā)表于 07-28 10:58 ?1475次閱讀
    <b class='flag-5'>3D</b>打印能用哪些材質(zhì)?

    TechWiz LCD 3D應(yīng)用:FFS仿真

    建模任務(wù) 堆棧結(jié)構(gòu) 建模過(guò)程 2.1使用TechWiz Layout繪制各層掩模版平面圖 2.2創(chuàng)建堆棧結(jié)構(gòu),并生成3D結(jié)構(gòu) 2.3 使用TechWiz LCD 3D進(jìn)行各項(xiàng)參數(shù)計(jì)算 3. 結(jié)果分析
    的頭像 發(fā)表于 07-14 14:08 ?365次閱讀
    TechWiz LCD <b class='flag-5'>3D</b>應(yīng)用:FFS仿真

    3D AD庫(kù)文件

    3D庫(kù)文件
    發(fā)表于 05-28 13:57 ?6次下載

    3D閃存的制造工藝與挑戰(zhàn)

    3D閃存有著更大容量、更低成本和更高性能的優(yōu)勢(shì),本文介紹了3D閃存的制造工藝與挑戰(zhàn)。
    的頭像 發(fā)表于 04-08 14:38 ?1557次閱讀
    <b class='flag-5'>3D</b>閃存的制造工藝與挑戰(zhàn)

    一種以圖像為中心的3D感知模型BIP3D

    在具身智能系統(tǒng)中,3D感知算法是一個(gè)關(guān)鍵組件,它在端側(cè)幫助可以幫助智能體理解環(huán)境信息,在云端可以用來(lái)輔助生成3D場(chǎng)景和3D標(biāo)簽,具備重要的研究?jī)r(jià)值?,F(xiàn)有主流算法主要依賴于點(diǎn)云作為輸入
    的頭像 發(fā)表于 03-17 13:44 ?751次閱讀
    一種以<b class='flag-5'>圖像</b>為中心的<b class='flag-5'>3D</b>感知模型BIP<b class='flag-5'>3D</b>

    ?超景深3D檢測(cè)顯微鏡技術(shù)解析

    ,確保產(chǎn)品質(zhì)量和生產(chǎn)效率。 在生物醫(yī)學(xué)領(lǐng)域,超景深3D檢測(cè)顯微鏡的應(yīng)用同樣令人矚目。傳統(tǒng)的顯微鏡在觀察細(xì)胞和組織時(shí),往往只能獲取二維圖像,難以全面反映其真實(shí)結(jié)構(gòu)。而上海桐爾的技術(shù)能夠幫助研究人員獲取
    發(fā)表于 02-25 10:51

    英倫科技裸眼3D便攜屏有哪些特點(diǎn)?

    英倫科技裸眼3D便攜屏采用了領(lǐng)先的光場(chǎng)裸眼3D技術(shù),無(wú)需佩戴3D眼鏡即可觀看,給用戶帶來(lái)裸眼看3D視頻的體驗(yàn),為用戶帶來(lái)更加便捷和自由的視覺(jué)享受。
    的頭像 發(fā)表于 02-06 14:20 ?677次閱讀
    英倫科技裸眼<b class='flag-5'>3D</b>便攜屏有哪些特點(diǎn)?

    SciChart 3D for WPF圖表庫(kù)

    SciChart 3D for WPF 是一個(gè)實(shí)時(shí)、高性能的 WPF 3D 圖表庫(kù),專為金融、醫(yī)療和科學(xué)應(yīng)用程序而設(shè)計(jì)。非常適合需要極致性能和豐富的交互式 3D 圖表的項(xiàng)目。 使用我們
    的頭像 發(fā)表于 01-23 13:49 ?1094次閱讀
    SciChart <b class='flag-5'>3D</b> for WPF圖表庫(kù)

    騰訊混元3D AI創(chuàng)作引擎正式發(fā)布

    近日,騰訊公司宣布其自主研發(fā)的混元3D AI創(chuàng)作引擎已正式上線。這一創(chuàng)新性的創(chuàng)作工具將為用戶帶來(lái)前所未有的3D內(nèi)容創(chuàng)作體驗(yàn),標(biāo)志著騰訊在AI技術(shù)領(lǐng)域的又一重大突破。 混元3D AI創(chuàng)作引擎憑借其強(qiáng)大
    的頭像 發(fā)表于 01-23 10:33 ?835次閱讀

    騰訊混元3D AI創(chuàng)作引擎正式上線

    近日,騰訊公司宣布其自主研發(fā)的混元3D AI創(chuàng)作引擎已正式上線。這一創(chuàng)新性的創(chuàng)作工具,標(biāo)志著騰訊在3D內(nèi)容生成領(lǐng)域邁出了重要一步。 混元3D AI創(chuàng)作引擎的核心功能極為強(qiáng)大,用戶只需通過(guò)簡(jiǎn)單的提示詞
    的頭像 發(fā)表于 01-22 10:26 ?809次閱讀

    AN-1249:使用ADV8003評(píng)估板將3D圖像轉(zhuǎn)換成2D圖像

    電子發(fā)燒友網(wǎng)站提供《AN-1249:使用ADV8003評(píng)估板將3D圖像轉(zhuǎn)換成2D圖像.pdf》資料免費(fèi)下載
    發(fā)表于 01-08 14:28 ?0次下載
    AN-1249:使用ADV8003評(píng)估板將<b class='flag-5'>3D</b><b class='flag-5'>圖像</b>轉(zhuǎn)換成2<b class='flag-5'>D</b><b class='flag-5'>圖像</b>

    uvled光固化3d打印技術(shù)

    說(shuō)到UVLED光固化3D打印技術(shù),那可是當(dāng)下3D打印領(lǐng)域的一股清流??!這項(xiàng)技術(shù)利用紫外線和光固化樹(shù)脂來(lái)制造3D打印模型,原理簡(jiǎn)單又高效。UVLED光固化3D打印,采用的是逐層固化的方式
    的頭像 發(fā)表于 12-24 13:13 ?1069次閱讀
    uvled光固化<b class='flag-5'>3d</b>打印技術(shù)