chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

Seam Carving-一種很強的圖像縮放算法

jt_rfid5 ? 來源:新機器視覺 ? 作者:Mine268 ? 2022-11-12 10:37 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

Seam Carving

一種很強的圖像縮放算法

0簡介

我們在排版的時候可能會遇到一些尷尬的情況。一張圖片原本是豎著的,而你希望把它當(dāng)作一張寬屏圖片,于是你只好對它進(jìn)行拉伸。

撫子的形狀瞬間變得不可描述起來。有沒有什么辦法,能不改變前景撫子的形象,只是拉伸背景的天空呢?也許你會想到萬能的神經(jīng)網(wǎng)絡(luò)。但早在神經(jīng)網(wǎng)絡(luò)火遍大江南北之前,就有一種方法流行于世間:Seam Carving。它可以做到這樣:

完美符合我們的要求!那么這個仿佛魔法一樣的Seam Carving是如何工作的呢?

01什么是圖像

我們這里將所談?wù)摰降膱D像限定為二維的像素圖象,而不是矢量圖象或者三維的體素組成的“圖像”之類的東西。對于一幅圖像,它的每個像素?fù)碛幸粋€整數(shù)坐標(biāo),同時擁有一個顏色,后者以 RGB 的形式表現(xiàn)。

當(dāng)人看到圖像的時候,主要是通過識別圖像當(dāng)中的邊緣來分辨圖像中的物體的,這提示我們邊緣的信息對于尋找圖像中的主要物體有著重要的作用。如果我們在圖像縮放的時候能夠盡量不影響到這些像素,那么就有可能做到在保證圖像中主要物體的比例不變的情況下拉伸背景。就像這樣

由此我們可以得出結(jié)論:通過依次刪除圖像中若干條自上而下和自左而右的像素通路,就可以達(dá)到“縮放”的目的。就自上而下的像素通路來說,這樣的通路寬度為 1,從圖像的第一行連接到圖像的最后一行,在每一行中只占據(jù)一個像素,相鄰行的像素的水平坐標(biāo)相差在 -1 到 1 之間。刪除這樣的自上而下的像素保證了圖像的寬度減一的同時不會出現(xiàn)寬度不同的行;自左而右的像素通路也是同理。

圖中的紅線分別是一條垂直通路和水平通路。如何找到這樣的像素通路,穿過盡可能少的重要物體?為此,我們引入了一個概念:“能量”。

02能量,又是能量

能量在這里起到的作用是表征像素的重要程度。先從圖像的基本元素的能量——像素的能量說起。對于單個像素,我們可以定義其能量形式為:

971f687a-61b1-11ed-8abf-dac502259ad0.png

其中,字母I表示像素灰度值,第一個偏導(dǎo)項就表示了色彩在這個像素變化的劇烈程度。如果我們將 RGB 顏色的像素的顏色看作一個三維向量,那么其能量形式也會是一個三維向量,這對于算法的后續(xù)實現(xiàn)是不利的。在實現(xiàn)中,我們可以用灰度標(biāo)量代替 RGB 三維向量參與運算,因為人眼對灰度的敏感度遠(yuǎn)高于色彩。公式看起來不太直觀,來看一個例子:

與人物有關(guān)的部分,細(xì)節(jié)比較多,對應(yīng)的顏色變化也更明顯,能量也就越高。相比之下,背景部分比如天空的顏色變化不太明顯,能量普遍比較低。對應(yīng)到上圖中,可能找到的垂直能量通路就是左側(cè)的天空,刪除之后并不會影響魚和人物的部分。

對于任意的一條自上而下的像素通路,該通路的能量就是該通路中所有像素的能量的和。

03利用能量進(jìn)行分割

前文說到,像素的能量表征了像素的重要程度,那么像素通路的能量就表征了像素通路中所有像素的總體重要程度,也就表征了該通路穿過的重要物體的多寡,也就表征了刪除這條像素通路對圖像中重要物體的影響程度的大小。刪除一條能量最小的像素通路對圖像中重要物體的影響是最小的。

對于這樣一張圖像,如果對其進(jìn)行縮放,我們希望保留不同顏色間的分界線,使其形狀和比例盡可能地不改變。即這幾條分界線的重要性應(yīng)該盡可能地高。根據(jù)我們關(guān)于能量的定義,分界線附近的像素的能量顯著地高于色塊中的像素。如果要被刪去的像素通路主要通過色塊區(qū)域,那么分界線的形狀就可以得到保留了。

那么現(xiàn)在的問題就變成了如何尋找一條能量最小的像素通路,這里以自上而下的像素通路說明尋找這樣的像素通路的方式。這就轉(zhuǎn)換為了一個經(jīng)典的動態(tài)規(guī)劃問題,形式化的轉(zhuǎn)移方程如下:

我們記 dpi 為從圖像的第一行到第 i 行的第 j 個像素的通路中能量最小的通路的能量 e 以及該像素在該通路上的前驅(qū) p。第 i 行的第 j 個像素的能量為 e(i,j)。那么

97acb4a0-61b1-11ed-8abf-dac502259ad0.png

這個公式可能還是有點太過抽象了。由于通路一定是連通的,也就是某一個像素只可能與三個像素位于同一條通路內(nèi),分別是它的左上、正上和右上。

97bcc00c-61b1-11ed-8abf-dac502259ad0.png

如果我們分別知道它左上、正上和右上的三個像素所在的通路的最低能量,只需要選出能量最低的一條并加上自己的能量,就構(gòu)成了當(dāng)前像素的最短能量通路。換言之,這其實是一種歸納法:

·第一行每個像素的累積能量是自己的能量值

·除此之外每一行每個像素的累計能量是上一行的三個相鄰像素中最低的累積能量加上自己的能量值

·最后一行的累計能量最低的就代表了一條能量最短的通路

當(dāng)然,這里還有一個小小的擴(kuò)展:現(xiàn)在有一個希望縮減的圖像,其寬高分別需要縮減 dw 和 dh 個像素。這就意味著這張圖象需要刪去 dw 和 dh 條能量最小的自上而下的通路和自左而右的通路。我們可以選擇先刪除自左而右的通路,再刪除自上而下的通路,反之亦可。但是為了追求刪除通路的總能量和最小——這樣全部刪除掉的像素對重要物體的影響最小,我們還可以優(yōu)化這個刪除順序。

這個問題也可以用動態(tài)規(guī)劃的方法解決。不妨記 dq[i] [j] 為原圖像在水平縮減 i 個像素長度、垂直縮減 j 個像素長度的過程中所有刪去的像素通路的能量值和的最小值,由于寬高分別為 x 和 y 的圖像在這種縮放方式下只有可能通過 寬高為 (x+1,y) 或 (x,y+1) 的圖像縮減而來,所以有

97d5280e-61b1-11ed-8abf-dac502259ad0.png

有了上面的經(jīng)驗,讀者能否自己理解這個轉(zhuǎn)移方程的含義呢?

最后再來看一個利用Seam Carving方法處理的例子:

很多細(xì)節(jié)得到了保留,比起直接拉伸來說要好太多了。

04結(jié)語

本文介紹的這種Seam Carving方法由Avidan等人發(fā)明,并發(fā)表在2007年的Siggraph中,目前已經(jīng)有非常廣泛的應(yīng)用,在Photoshop等軟件中都可以找到它的身影。比起目前主流的神經(jīng)網(wǎng)絡(luò)方法來說,它要簡單的多,并且有很大的改良余地,最終效果也不遑多讓。有興趣的同學(xué)也可以進(jìn)一步的研究或者和我討論。

審核編輯:湯梓紅
聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 算法
    +關(guān)注

    關(guān)注

    23

    文章

    4738

    瀏覽量

    96711
  • Seam
    +關(guān)注

    關(guān)注

    0

    文章

    4

    瀏覽量

    5993
  • 圖像縮放
    +關(guān)注

    關(guān)注

    0

    文章

    8

    瀏覽量

    3495

原文標(biāo)題:【光電智造】Seam Carving - 一種很強的圖像縮放算法

文章出處:【微信號:今日光電,微信公眾號:今日光電】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    基于FPGA的CLAHE圖像增強算法設(shè)計

    CLAHE圖像增強算法又稱為對比度有限的自適應(yīng)直方圖均衡算法,其算法原理是通過有限的調(diào)整圖像局部對比度來增強有效信號和抑制噪聲信號。
    的頭像 發(fā)表于 10-15 10:14 ?88次閱讀
    基于FPGA的CLAHE<b class='flag-5'>圖像</b>增強<b class='flag-5'>算法</b>設(shè)計

    永磁同步電機(PMSM)調(diào)速系統(tǒng)的智能控制算法研究

    為了解決PMSM 速度控制問題,文中提出了一種模糊自整定 PI的控制方案,并用 MATLAB 對系統(tǒng) 進(jìn)行了建模仿真驗證。仿真實驗結(jié)果表明,該新型控制算法與傳統(tǒng)的PI 控制相比較,具有很強
    發(fā)表于 03-26 14:09

    一種基于分?jǐn)?shù)階 PID 直流電機調(diào)速的 AGV 控制系統(tǒng)

    為設(shè)計一種低成本、抗干擾、穩(wěn)定可靠的 AGV,提出一種基于磁帶導(dǎo)航的 AGV 系統(tǒng)。采用 Megawin 公司的80C51單片機為控制核心,以并排對稱設(shè)計的霍爾傳感器實現(xiàn)循跡和糾偏,紅外光
    發(fā)表于 03-25 15:10

    一種圖像為中心的3D感知模型BIP3D

    在具身智能系統(tǒng)中,3D感知算法個關(guān)鍵組件,它在端側(cè)幫助可以幫助智能體理解環(huán)境信息,在云端可以用來輔助生成3D場景和3D標(biāo)簽,具備重要的研究價值?,F(xiàn)有主流算法主要依賴于點云作為輸入
    的頭像 發(fā)表于 03-17 13:44 ?752次閱讀
    <b class='flag-5'>一種</b>以<b class='flag-5'>圖像</b>為中心的3D感知模型BIP3D

    一種基于正交與縮放變換的大模型量化方法

    近年來,大規(guī)模語言模型(Large Language Models, LLMs)在自然語言處理領(lǐng)域取得了革命性進(jìn)展。以 GPT 系列、LLaMA 等為代表的模型,通過千億級參數(shù)的復(fù)雜結(jié)構(gòu)展現(xiàn)出強大的語義理解和生成能力。
    的頭像 發(fā)表于 03-04 11:10 ?727次閱讀
    <b class='flag-5'>一種</b>基于正交與<b class='flag-5'>縮放</b>變換的大模型量化方法

    在i.MX RT處理器上使用PXP實現(xiàn)縮放和旋轉(zhuǎn)組合操作

    本文主要探討如何使用PXP實現(xiàn)縮放和旋轉(zhuǎn)組合操作,PXP是NXP推出的個2D圖形加速器,主要完成對圖像的數(shù)據(jù)格式轉(zhuǎn)換、固定角度旋轉(zhuǎn)(90°,180°,270°),任意比例縮放、混色,
    的頭像 發(fā)表于 02-20 10:53 ?1420次閱讀
    在i.MX RT處理器上使用PXP實現(xiàn)<b class='flag-5'>縮放</b>和旋轉(zhuǎn)組合操作

    DLPC3430投影圖像無法縮放怎么解決?

    ,3430可以縮放1280*720的輸入到854*480 但是實際使用的時候發(fā)現(xiàn),圖像只投影了1280*720前面854*480的部分,效果如下, 紅框區(qū)域為完整數(shù)據(jù)輸入,藍(lán)框部分為3430的投影輸出
    發(fā)表于 02-19 07:40

    DLPC7540EVM是否支持自定義的圖像處理算法,以及如何進(jìn)行算法的移植?

    是否支持自定義的圖像處理算法,以及如何進(jìn)行算法的移植?
    發(fā)表于 02-17 08:25

    FPGA上的圖像處理算法集成與優(yōu)化

    、Tophat形態(tài)學(xué)濾波、RAW8轉(zhuǎn)RGB888、彩色圖像均值濾波、Alpha背景疊加、直方圖灰度拉伸算法以及自動白平衡算法。每種算法都提供了實現(xiàn)方法和相關(guān)公式,涵蓋了
    的頭像 發(fā)表于 02-14 13:46 ?975次閱讀
    FPGA上的<b class='flag-5'>圖像</b>處理<b class='flag-5'>算法</b>集成與優(yōu)化

    如何使用圖像采集卡

    在現(xiàn)代數(shù)字技術(shù)的不斷發(fā)展中,圖像采集卡作為一種重要的硬件設(shè)備,越來越普遍地應(yīng)用于各類領(lǐng)域,包括視頻監(jiān)控、醫(yī)療影像、影視制作及游戲直播等。圖像采集卡通過將模擬信號轉(zhuǎn)換為數(shù)字信號,使得計算機能夠?qū)σ?/div>
    的頭像 發(fā)表于 12-13 15:03 ?1462次閱讀
    如何使用<b class='flag-5'>圖像</b>采集卡

    圖像高斯濾波的原理及FPGA實現(xiàn)思路

    (Gaussian Blur),是一種高斯低通濾波。通常這個算法也可以用來模糊圖像,提供模糊濾鏡。也可以用來過濾自然界的高斯白噪聲。 高斯分布(正態(tài)分布)是個常見的連續(xù)概率分布,正態(tài)
    的頭像 發(fā)表于 12-07 09:12 ?2278次閱讀
    <b class='flag-5'>圖像</b>高斯濾波的原理及FPGA實現(xiàn)思路

    百問FB顯示開發(fā)圖像處理 - 圖像調(diào)整

    \"。 原理淺析 ?要理解這個圖像縮放算法的原理,最重要的是需要理解:對于圖像上的每個像素點,它縮放
    發(fā)表于 12-02 09:34

    EPS格式圖像的最佳使用場景

    EPS(Encapsulated PostScript)是一種廣泛使用的矢量圖形文件格式,最初由Adobe公司開發(fā)。它以其高兼容性、可縮放性和高質(zhì)量的圖像輸出而受到設(shè)計師和出版業(yè)的青睞。 1. 專業(yè)
    的頭像 發(fā)表于 11-19 10:33 ?2173次閱讀

    一種基于深度學(xué)習(xí)的二維拉曼光譜算法

    近日,天津大學(xué)精密儀器與光電子工程學(xué)院的光子芯片實驗室提出了一種基于深度學(xué)習(xí)的二維拉曼光譜算法,成果以“Rapid and accurate bacteria identification
    的頭像 發(fā)表于 11-07 09:08 ?1054次閱讀
    <b class='flag-5'>一種</b>基于深度學(xué)習(xí)的二維拉曼光譜<b class='flag-5'>算法</b>

    使用功率縮放

    電子發(fā)燒友網(wǎng)站提供《使用功率縮放庫.pdf》資料免費下載
    發(fā)表于 10-18 10:24 ?0次下載
    使用功率<b class='flag-5'>縮放</b>庫