理论电影免费,好大快点快点吸我奶

0. 筆者個(gè)人體會(huì)

分割一切模型（SAM）這幾年在CV領(lǐng)域應(yīng)用很多，很多文章都在努力提高SAM的分割精度，但SAM分割的前提是高質(zhì)量的提示（點(diǎn)、框）。但是實(shí)踐中的SAM經(jīng)常遇到不準(zhǔn)確的提示，尤其是眾包標(biāo)注平臺(tái)，這種不準(zhǔn)確的提示會(huì)導(dǎo)致分割錯(cuò)誤。

這也就是Stable Segment Anything Model這篇文章想要解決的問(wèn)題，提出了一種新的分割模型Stable-SAM，希望遇到錯(cuò)誤提示時(shí)也能實(shí)現(xiàn)穩(wěn)定分割！

1. 效果展示

SAM、HQ-SAM、Stable-SAM在提供次優(yōu)提示時(shí)的性能比較，Stable-SAM明顯優(yōu)于其他算法。

SAM和Stable-SAM的預(yù)測(cè)Mask和圖像特征的權(quán)重對(duì)比，橙色圓圈表示注意力權(quán)重，半徑越大表示得分越高。(a) 當(dāng)提供高質(zhì)量提示時(shí)，SAM分割結(jié)果很好。(b) 微小的提示修改會(huì)導(dǎo)致不穩(wěn)定的分割輸出，SAM錯(cuò)誤分割了背景。(c) Stable-SAM通過(guò)將更多的特征采樣注意力轉(zhuǎn)移到目標(biāo)對(duì)象上來(lái)準(zhǔn)確地分割目標(biāo)對(duì)象。

2. 具體原理是什么？

Stable-SAM的具體pipeline由三部分組成：

(a)是SAM的Mask解碼器中的可變形采樣插件(DSP)和可變形路由插件(DRP)。DSP采用小偏移網(wǎng)絡(luò)(b)來(lái)預(yù)測(cè)特征采樣偏移。隨后DSP在更新的采樣位置對(duì)可變形圖像特征進(jìn)行重新采樣，并將它們饋送到SAM的標(biāo)記到圖像注意力。DRP采用一個(gè)小型MLP網(wǎng)絡(luò)(c)來(lái)根據(jù)輸入提示質(zhì)量調(diào)節(jié)DSP激活的程度。注意，DSP自適應(yīng)地單獨(dú)調(diào)整圖像特征采樣位置，不會(huì)改變?cè)糞AM模型。

3. 和其他SOTA方法對(duì)比如何？

在不同質(zhì)量的提示下，SAM、DT-SAM(微調(diào)SAM的Mask解碼器)、PT-SAM(微調(diào)SAM的提示token及其對(duì)應(yīng)的輸出MLP層)、HQ-SAM和Stable-SAM在HQ數(shù)據(jù)集上的對(duì)比。這里也推薦工坊推出的新課程《如何將深度學(xué)習(xí)模型部署到實(shí)際工程中？（分類(lèi)+檢測(cè)+分割）》。

MS COCO和SGinW數(shù)據(jù)集上的對(duì)比，Stable-SAM最優(yōu)。

審核編輯：黃飛

聲明：本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人，不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用，如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題，請(qǐng)聯(lián)系本站處理。舉報(bào)投訴