Python圖像處理庫(2)

本文轉載自查看原文 2015-05-17 16:35 4701 Python

1.4　SciPy

SciPy（http://scipy.org/）是建立在 NumPy 基礎上，用於數值運算的開源工具包。SciPy 提供很多高效的操作，可以實現數值積分、優化、統計、信號處理，以及對我們來說最重要的圖像處理功能。接下來，本節會介紹 SciPy 中大量有用的模塊。SciPy 是個開源工具包，可以從http://scipy.org/Download 下載。

1.4.1　圖像模糊

圖像的高斯模糊是非常經典的圖像卷積例子。本質上，圖像模糊就是將（灰度）圖像 I 和一個高斯核進行卷積操作：

Iσ = I*Gσ

其中 * 表示卷積操作；Gσ 是標准差為 σ 的二維高斯核，定義為 :

$G_\sigma=\frac{1}{2\pi\sigma}e^{-(x^2+y^2)/2\sigma^2}$

高斯模糊通常是其他圖像處理操作的一部分，比如圖像插值操作、興趣點計算以及很多其他應用。

SciPy 有用來做濾波操作的 scipy.ndimage.filters 模塊。該模塊使用快速一維分離的方式來計算卷積。你可以像下面這樣來使用它：

from PIL import Image
from numpy import *
from scipy.ndimage import filters

im = array(Image.open('empire.jpg').convert('L'))
im2 = filters.gaussian_filter(im,5)

上面 guassian_filter() 函數的最后一個參數表示標准差。

圖 1-9 顯示了隨着 σ 的增加，一幅圖像被模糊的程度。σ 越大，處理后的圖像細節丟失越多。如果打算模糊一幅彩色圖像，只需簡單地對每一個顏色通道進行高斯模糊：

im = array(Image.open('empire.jpg'))
im2 = zeros(im.shape)
for i in range(3):
  im2[:,:,i] = filters.gaussian_filter(im[:,:,i],5)
im2 = uint8(im2)

在上面的腳本中，最后並不總是需要將圖像轉換成 uint8 格式，這里只是將像素值用八位來表示。我們也可以使用：

im2 = array(im2,'uint8')

來完成轉換。

關於該模塊更多的內容以及不同參數的選擇，請查看http://docs.scipy.org/doc/scipy/reference/ndimage.html 上 SciPy 文檔中的 scipy.ndimage部分。

圖 1-9：使用 scipy.ndimage.filters 模塊進行高斯模糊：（a）原始灰度圖像；（b）使用 σ=2 的高斯濾波器；（c）使用 σ=5 的高斯濾波器；（d）使用 σ=10 的高斯濾波器

1.4.2　圖像導數

整本書中可以看到，在很多應用中圖像強度的變化情況是非常重要的信息。強度的變化可以用灰度圖像 I（對於彩色圖像，通常對每個顏色通道分別計算導數）的 x 和 y 方向導數 Ix 和 Iy 進行描述。

圖像的梯度向量為∇I = [Ix, Iy]T。梯度有兩個重要的屬性，一是梯度的大小：

$\left|\boldsymbol{\nabla I}\right|=\sqrt{{\boldsymbol{I}_x}^2+{\boldsymbol{I}_y}^2}$

它描述了圖像強度變化的強弱，一是梯度的角度：

α=arctan2(Iy, Ix)

描述了圖像中在每個點（像素）上強度變化最大的方向。NumPy 中的 arctan2() 函數返回弧度表示的有符號角度，角度的變化區間為 -π...π。

我們可以用離散近似的方式來計算圖像的導數。圖像導數大多數可以通過卷積簡單地實現：

Ix=I*Dx 和 Iy=I*Dy

對於 Dx 和 Dy，通常選擇 Prewitt 濾波器：

$D_x=\begin{vmatrix}-1&0&1\\-1&0&1\\ -1&0&1\end{vmatrix}$ 和 $D_y=\begin{vmatrix}-1&-1&-1\\0&0&0\\ 1&1&1\end{vmatrix}$

或者 Sobel 濾波器：

$D_x=\begin{vmatrix}-1&0&1\\-2&0&2\\ -1&0&1\end{vmatrix}$ 和 $D_y=\begin{vmatrix}-1&-2&-1\\0&0&0\\ 1&2&1\end{vmatrix}$

這些導數濾波器可以使用 scipy.ndimage.filters 模塊的標准卷積操作來簡單地實現，例如：

from PIL import Image
from numpy import *
from scipy.ndimage import filters

im = array(Image.open('empire.jpg').convert('L'))

# Sobel 導數濾波器
imx = zeros(im.shape)
filters.sobel(im,1,imx)

imy = zeros(im.shape)
filters.sobel(im,0,imy)

magnitude = sqrt(imx**2+imy**2)

上面的腳本使用 Sobel 濾波器來計算 x 和 y 的方向導數，以及梯度大小。sobel() 函數的第二個參數表示選擇 x 或者 y 方向導數，第三個參數保存輸出的變量。圖 1-10 顯示了用 Sobel 濾波器計算出的導數圖像。在兩個導數圖像中，正導數顯示為亮的像素，負導數顯示為暗的像素。灰色區域表示導數的值接近於零。

圖 1-10：使用 Sobel 導數濾波器計算導數圖像：（a）原始灰度圖像；（b）x 導數圖像；（c）y導數圖像；（d）梯度大小圖像

上述計算圖像導數的方法有一些缺陷：在該方法中，濾波器的尺度需要隨着圖像分辨率的變化而變化。為了在圖像噪聲方面更穩健，以及在任意尺度上計算導數，我們可以使用高斯導數濾波器：

Ix=I*Gσx 和 Iy=I*Gσy

其中，Gσx和 Gσy 表示 Gσ 在 x 和 y 方向上的導數，Gσ 為標准差為 σ 的高斯函數。

我們之前用於模糊的 filters.gaussian_filter() 函數可以接受額外的參數，用來計算高斯導數。可以簡單地按照下面的方式來處理：

sigma = 5 # 標准差

imx = zeros(im.shape)
filters.gaussian_filter(im, (sigma,sigma), (0,1), imx)

imy = zeros(im.shape)
filters.gaussian_filter(im, (sigma,sigma), (1,0), imy)

該函數的第三個參數指定對每個方向計算哪種類型的導數，第二個參數為使用的標准差。你可以查看相應文檔了解詳情。圖 1-11 顯示了不同尺度下的導數圖像和梯度大小。你可以和圖 1-9 中做相同尺度模糊的圖像做比較。

圖 1-11：使用高斯導數計算圖像導數：x 導數圖像（上），y 導數圖像（中），以及梯度大小圖像（下）；（a）為原始灰度圖像，（b）為使用 σ=2 的高斯導數濾波器處理后的圖像，（c）為使用 σ=5 的高斯導數濾波器處理后的圖像，（d）為使用 σ=10 的高斯導數濾波器處理后的圖像

1.4.3　形態學：對象計數

形態學（或數學形態學）是度量和分析基本形狀的圖像處理方法的基本框架與集合。形態學通常用於處理二值圖像，但是也能夠用於灰度圖像。二值圖像是指圖像的每個像素只能取兩個值，通常是 0 和 1。二值圖像通常是，在計算物體的數目，或者度量其大小時，對一幅圖像進行閾值化后的結果。你可以從 http://en.wikipedia.org/wiki/Mathematical_morphology 大體了解形態學及其處理圖像的方式。

scipy.ndimage 中的 morphology 模塊可以實現形態學操作。你可以使用 scipy.ndimage 中的measurements 模塊來實現二值圖像的計數和度量功能。下面通過一個簡單的例子介紹如何使用它們。

考慮在圖 1-12a3 里的二值圖像，計算該圖像中的對象個數可以通過下面的腳本實現：

3這個圖像實際上是圖像“分割”后的結果。如果你想知道該圖像是如何創建的，可以查看 9.3 節。

from scipy.ndimage import measurements,morphology

# 載入圖像，然后使用閾值化操作，以保證處理的圖像為二值圖像
im = array(Image.open('houses.png').convert('L'))
im = 1*(im<</span>128)

labels, nbr_objects = measurements.label(im)
print "Number of objects:", nbr_objects

上面的腳本首先載入該圖像，通過閾值化方式來確保該圖像是二值圖像。通過和 1 相乘，腳本將布爾數組轉換成二進制表示。然后，我們使用 label() 函數尋找單個的物體，並且按照它們屬於哪個對象將整數標簽給像素賦值。圖 1-12b 是 labels 數組的圖像。圖像的灰度值表示對象的標簽。可以看到，在一些對象之間有一些小的連接。進行二進制開（binary open）操作，我們可以將其移除：

# 形態學開操作更好地分離各個對象
im_open = morphology.binary_opening(im,ones((9,5)),iterations=2)

labels_open, nbr_objects_open = measurements.label(im_open)
print "Number of objects:", nbr_objects_open

binary_opening() 函數的第二個參數指定一個數組結構元素。該數組表示以一個像素為中心時，使用哪些相鄰像素。在這種情況下，我們在 y 方向上使用 9 個像素（上面 4 個像素、像素本身、下面 4 個像素），在 x 方向上使用 5 個像素。你可以指定任意數組為結構元素，數組中的非零元素決定使用哪些相鄰像素。參數 iterations 決定執行該操作的次數。你可以嘗試使用不同的迭代次數 iterations 值，看一下對象的數目如何變化。你可以在圖 1-12c 與圖 1-12d 中查看經過開操作后的圖像，以及相應的標簽圖像。正如你想象的一樣，binary_closing() 函數實現相反的操作。我們將該函數和在 morphology 和 measurements 模塊中的其他函數的用法留作練習。你可以從 scipy.ndimage 模塊文檔 http://docs.scipy.org/doc/scipy/reference/ndimage.html 中了解關於這些函數的更多知識。

圖 1-12：形態學示例。使用二值開操作將對象分開，然后計算物體的數目：（a）為原始二值圖像；（b）為對應原始圖像的標簽圖像，其中灰度值表示物體的標簽；（c）為使用開操作后的二值圖像；（d）為開操作后圖像的標簽圖像

1.4.4　一些有用的`SciPy`模塊

SciPy 中包含一些用於輸入和輸出的實用模塊。下面介紹其中兩個模塊：io 和 misc。

讀寫.mat文件

如果你有一些數據，或者在網上下載到一些有趣的數據集，這些數據以 Matlab 的 .mat 文件格式存儲，那么可以使用 scipy.io 模塊進行讀取。
```
data = scipy.io.loadmat('test.mat')
```
上面代碼中，data 對象包含一個字典，字典中的鍵對應於保存在原始 .mat 文件中的變量名。由於這些變量是數組格式的，因此可以很方便地保存到 .mat 文件中。你僅需創建一個字典（其中要包含你想要保存的所有變量），然后使用 savemat() 函數：
```
data = {}
data['x'] = x
scipy.io.savemat('test.mat',data)
```
因為上面的腳本保存的是數組 x，所以當讀入到 Matlab 中時，變量的名字仍為 x。關於scipy.io 模塊的更多內容，請參見在線文檔http://docs.scipy.org/doc/scipy/reference/io.html。
以圖像形式保存數組

因為我們需要對圖像進行操作，並且需要使用數組對象來做運算，所以將數組直接保存為圖像文件 4 非常有用。本書中的很多圖像都是這樣的創建的。

imsave() 函數可以從 scipy.misc 模塊中載入。要將數組 im 保存到文件中，可以使用下面的命令：
```
from scipy.misc import imsave
imsave('test.jpg',im)
```
scipy.misc 模塊同樣包含了著名的 Lena 測試圖像：
```
lena = scipy.misc.lena()
```
該腳本返回一個 512×512 的灰度圖像數組。

4所有 Pylab 圖均可保存為多種圖像格式，方法是點擊圖像窗口中的“保存”按鈕。

1.5　高級示例：圖像去噪

我們通過一個非常實用的例子——圖像的去噪——來結束本章。圖像去噪是在去除圖像噪聲的同時，盡可能地保留圖像細節和結構的處理技術。我們這里使用 ROF（Rudin-Osher-Fatemi）去噪模型。該模型最早出現在文獻 [28] 中。圖像去噪對於很多應用來說都非常重要；這些應用范圍很廣，小到讓你的假期照片看起來更漂亮，大到提高衛星圖像的質量。ROF 模型具有很好的性質：使處理后的圖像更平滑，同時保持圖像邊緣和結構信息。

ROF 模型的數學基礎和處理技巧非常高深，不在本書講述范圍之內。在講述如何基於 Chambolle 提出的算法 [5] 實現 ROF 求解器之前，本書首先簡要介紹一下 ROF 模型。

一幅（灰度）圖像 I 的全變差（Total Variation，TV）定義為梯度范數之和。在連續表示的情況下，全變差表示為：

$J(\boldsymbol{I})=\int\left|\nabla\boldsymbol{I}\right|\text{dx}$ 　　　　　　　　　　　　（1.1）

在離散表示的情況下，全變差表示為：

$J(\boldsymbol{I})=\sum_{\text{x}}\left|\nabla\boldsymbol{I}\right|$

其中，上面的式子是在所有圖像坐標 x=[x, y] 上取和。

在 Chambolle 提出的 ROF 模型里，目標函數為尋找降噪后的圖像 U，使下式最小：

$\min_U\left|\left|\boldsymbol{I}-\boldsymbol{U}\right|\right|^2+2\lambda J(\boldsymbol{U}),$

其中范數 ||I-U|| 是去噪后圖像 U 和原始圖像 I 差異的度量。也就是說，本質上該模型使去噪后的圖像像素值“平坦”變化，但是在圖像區域的邊緣上，允許去噪后的圖像像素值“跳躍”變化。

按照論文 [5] 中的算法，我們可以按照下面的代碼實現 ROF 模型去噪：

from numpy import *

def denoise(im,U_init,tolerance=0.1,tau=0.125,tv_weight=100):
  """ 使用A. Chambolle（2005）在公式（11）中的計算步驟實現Rudin-Osher-Fatemi（ROF）去噪模型

    輸入：含有噪聲的輸入圖像（灰度圖像）、U 的初始值、TV 正則項權值、步長、停業條件

    輸出：去噪和去除紋理后的圖像、紋理殘留"""

m,n = im.shape # 噪聲圖像的大小

# 初始化
U = U_init
Px = im # 對偶域的x 分量
Py = im # 對偶域的y 分量
error = 1

while (error > tolerance):
  Uold = U

  # 原始變量的梯度
  GradUx = roll(U,-1,axis=1)-U # 變量U 梯度的x 分量
  GradUy = roll(U,-1,axis=0)-U # 變量U 梯度的y 分量

  # 更新對偶變量
  PxNew = Px + (tau/tv_weight)*GradUx
  PyNew = Py + (tau/tv_weight)*GradUy
  NormNew = maximum(1,sqrt(PxNew**2+PyNew**2))

  Px = PxNew/NormNew # 更新x 分量（對偶）
  Py = PyNew/NormNew # 更新y 分量（對偶）

  # 更新原始變量
  RxPx = roll(Px,1,axis=1) # 對x 分量進行向右x 軸平移
  RyPy = roll(Py,1,axis=0) # 對y 分量進行向右y 軸平移

  DivP = (Px-RxPx)+(Py-RyPy) # 對偶域的散度
  U = im + tv_weight*DivP # 更新原始變量

  # 更新誤差
  error = linalg.norm(U-Uold)/sqrt(n*m);

return U,im-U # 去噪后的圖像和紋理殘余

在這個例子中，我們使用了 roll() 函數。顧名思義，在一個坐標軸上，它循環“滾動”數組中的元素值。該函數可以非常方便地計算鄰域元素的差異，比如這里的導數。我們還使用了linalg.norm() 函數，該函數可以衡量兩個數組間（這個例子中是指圖像矩陣 U和 Uold）的差異。我們將這個 denoise() 函數保存到 rof.py 文件中。

下面使用一個合成的噪聲圖像示例來說明如何使用該函數：

from numpy import *
from numpy import random
from scipy.ndimage import filters
import rof

# 使用噪聲創建合成圖像
im = zeros((500,500))
im[100:400,100:400] = 128
im[200:300,200:300] = 255
im = im + 30*random.standard_normal((500,500))

U,T = rof.denoise(im,im)
G = filters.gaussian_filter(im,10)

# 保存生成結果
from scipy.misc import imsave
imsave('synth_rof.pdf',U)
imsave('synth_gaussian.pdf',G)

原始圖像和圖像的去噪結果如圖 1-13 所示。正如你所看到的，ROF 算法去噪后的圖像很好地保留了圖像的邊緣信息。

圖 1-13：使用 ROF 模型對合成圖像去噪：（a）為原始噪聲圖像；（b）為經過高斯模糊的圖像（σ=10）；（c）為經過 ROF 模型去噪后的圖像

下面看一下在實際圖像中使用 ROF 模型去噪的效果：

from PIL import Image
from pylab import *
import rof

im = array(Image.open('empire.jpg').convert('L'))
U,T = rof.denoise(im,im)

figure()
gray()
imshow(U)
axis('equal')
axis('off')
show()

經過 ROF 去噪后的圖像如圖 1-14c 所示。為了方便比較，該圖中同樣顯示了模糊后的圖像。可以看到，ROF 去噪后的圖像保留了邊緣和圖像的結構信息，同時模糊了“噪聲”。

圖 1-14：使用 ROF 模型對灰度圖像去噪：（a）為原始噪聲圖像；（b）為經過高斯模糊的圖像（σ=5）；（c）為經過 ROF 模型去噪后的圖像

免責聲明！

本站轉載的文章為個人學習借鑒使用，本站對版權不負任何法律責任。如果侵犯了您的隱私權益，請聯系本站郵箱yoyou2525@163.com刪除。

猜您在找 Python圖像處理庫(1) Python圖像處理庫——PIL python——PIL(圖像處理庫) python第三方庫-圖像處理庫pillow Python圖像處理庫：Pillow 初級教程 Python圖像處理庫PIL -- 學習資源 python PIL圖像處理 python skimage圖像處理(三) python skimage圖像處理(一) Python圖像處理庫PIL中圖像格式轉換