上采樣/下采樣
縮小圖像(或稱為下采樣(subsampled)或降采樣(downsampled))的主要目的有兩個:1、使得圖像符合顯示區域的大小;2、生成對應圖像的縮略圖。
放大圖像(或稱為上采樣(upsampling)或圖像插值(interpolating))的主要目的是放大原圖像,從而可以顯示在更高分辨率的顯示設備上。對圖像的縮放操作並不能帶來更多關於該圖像的信息, 因此圖像的質量將不可避免地受到影響。
下采樣原理:對於一幅圖像I尺寸為MN,對其進行s倍下采樣,即得到(M/s)(N/s)尺寸的得分辨率圖像,當然s應該是M和N的公約數才行,如果考慮的是矩陣形式的圖像,就是把原始圖像s*s窗口內的圖像變成一個像素,這個像素點的值就是窗口內所有像素的均值:
上采樣原理:圖像放大幾乎都是采用內插值方法,即在原有圖像像素的基礎上在像素點之間采用合適的插值算法插入新的元素。
應用:高斯金字塔、卷積神經網絡
卷積/逆卷積
卷積,聽起來抽象,實際上就是一個加權求和的過程,權重就是卷積核,一個二維矩陣中的數值。
一圖勝千言
作用:
在卷積神經網絡中利用了圖的局部特點,距離較遠的神經元之間關聯一般較低;
圖像中和同一個卷積核位置關聯的像素點共享權值,也直接降低了計算復雜度;
下采樣並不會改變原有物體的情況。
那么逆卷積是什么?
更應該翻譯乘轉置卷積。
例如對於一個圖像
輸入矩陣可展開為向量,記作x
輸出矩陣可展開為向量,記作y
卷積運算可表示為y = Cx
那么對於正向傳播就是轉換成了如上矩陣運算。
對於反向傳播來說,求導如下
逆卷積用來在卷積神經網絡結構的反向傳播中計算導數。