圖像的上采樣 下采樣


目的

縮小圖像(或稱為下采樣(subsampled)或降采樣(downsampled))的主要目的:

1、使得圖像符合顯示區域的大小;

2、生成對應圖像的縮略圖。

放大圖像(或稱為上采樣(upsampling)或圖像插值(interpolating))的主要目的是放大原圖像,從而可以顯示在更高分辨率的顯示設備上。

對圖像的縮放操作並不能帶來更多關於該圖像的信息, 因此圖像的質量將不可避免地受到影響。然而,確實有一些縮放方法能夠增加圖像的信息,從而使得縮放后的圖像質量超過原圖質量的。

原理

下采樣原理:對於一幅圖像I尺寸為MN,對其進行s倍下采樣,即得到(M/s)(N/s)尺寸的得分辨率圖像,當然s應該是M和N的公約數才行,如果考慮的是矩陣形式的圖像,就是把原始圖像s*s窗口內的圖像變成一個像素,這個像素點的值就是窗口內所有像素的均值:

上采樣原理:圖像放大幾乎都是采用內插值方法,即在原有圖像像素的基礎上在像素點之間采用合適的插值算法插入新的元素。

插值算法分類

對插值算法分類比較混亂,各人有各人的分類算法。文獻《圖像插值技術綜述》中簡略的將插值算法分為傳統插值、 基於邊緣的插值和基於區域的插值3類,作為初學者入門明晰插值算法還是有幫助。
1.傳統差值原理和評價
在傳統圖像插值算法中,鄰插值較簡單,容易實現,早期的時候應用比較普遍。但是,該方法會在新圖像中產生明顯的鋸齒邊緣和馬賽克現象。雙線性插值法具有平滑功能,能有效地克服鄰法的不足,但會退化圖像的高頻部分,使圖像細節變模糊。在放大倍數比較高時,高階插值,如雙三次和三次樣條插值等比低階插值效果好。這些插值算法可以使插值生成的像素灰度值延續原圖像灰度變化的連續性,從而使放大圖像濃淡變化自然平滑。但是在圖像中,有些像素與相鄰像素間灰度值存在突變,即存在灰度不連續性。這些具有灰度值突變的像素就是圖像中描述對象的輪廓或紋理圖像的邊緣像素。在圖像放大中,對這些具有不連續灰度特性的像素,如果采用常規的插值算法生成新增加的像素,勢必會使放大圖像的輪廓和紋理模糊,降低圖像質量。
2.基於邊緣的圖像插值算法
為了克服傳統方法的不足, 提出了許多邊緣保護的插值方法,對插值圖像的邊緣有一定的增強, 使得圖像的視覺效果更好, 邊緣保護的插值方法可以分為兩類: 基於原始低分辨圖像邊緣的方法和基於插值后高分辨率圖像邊緣的方法。基於原始低分辨率圖像邊緣的方法:( 1)首先檢測低分辨率圖像的邊緣, 然后根據檢測的邊緣將像素分類處理, 對於平坦區域的像素,采用傳統方法插值;對於邊緣區域的像素, 設計特殊插值方法, 以達到保持邊緣細節的目的。(2)基於插值后高分辨率圖像邊緣的方法這類插值方法:首先采用傳統方法插值低分辨率圖像,然后檢測高分辨率圖像的邊緣,最后對邊緣及附近像素進行特殊處理, 以去除模糊, 增強圖像的邊緣。
3.基於區域的圖像插值算法
首先將原始低分辨率圖像分割成不同區域,然后將插值點映射到低分辨率圖像, 判斷其所屬區域, 最后根據插值點的鄰域像素設計不同的插值公式, 計算插值點的值。

CNN中的池化操作

采樣層是使用 pooling的相關技術來實現的,目的就是用來降低特征的維度並保留有效信息,一定程度上避免過擬合。但是pooling的目的不僅僅是這些,他的目的是保持旋轉、平移、伸縮不變形等。

采樣有最大值采樣,平均值采樣,求和區域采樣和隨機區域采樣等。池化也是這樣的,比如最大值池化,平均值池化,隨機池化,求和區域池化等。

  • mean-pooling,即對鄰域內特征點只求平均,
  • max-pooling,即對鄰域內特征點取最大。

根據相關理論,特征提取的誤差主要來自兩個方面:(1)鄰域大小受限造成的估計值方差增大;(2)卷積層參數誤差造成估計均值的偏移。一般來說,mean-pooling能減小第一種誤差,更多的保留圖像的背景信息,max-pooling能減小第二種誤差,更多的保留紋理信息。

  • Stochastic-pooling則介於兩者之間,通過對像素點按照數值大小賦予概率,再按照概率進行亞采樣,再平均

來源:https://blog.csdn.net/stf1065716904/article/details/78490868 https://blog.csdn.net/majinlei121/article/details/46742339


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM