Python+OpenCV圖像處理(十二)—— 圖像梯度


簡介:圖像梯度可以把圖像看成二維離散函數,圖像梯度其實就是這個二維離散函數的求導。

Sobel算子是普通一階差分,是基於尋找梯度強度。拉普拉斯算子(二階差分)是基於過零點檢測。通過計算梯度,設置閥值,得到邊緣圖像。

以下各種算子的原理可參考:https://blog.csdn.net/poem_qianmo/article/details/25560901

一、Sobel算子

代碼如下:

import cv2 as cv
#Sobel算子
def sobel_demo(image):
    grad_x = cv.Sobel(image, cv.CV_32F, 1, 0)   #對x求一階導
    grad_y = cv.Sobel(image, cv.CV_32F, 0, 1)   #對y求一階導
    gradx = cv.convertScaleAbs(grad_x)  #用convertScaleAbs()函數將其轉回原來的uint8形式
    grady = cv.convertScaleAbs(grad_y)
    cv.imshow("gradient_x", gradx)  #x方向上的梯度
    cv.imshow("gradient_y", grady)  #y方向上的梯度
    gradxy = cv.addWeighted(gradx, 0.5, grady, 0.5, 0) #圖片融合
    cv.imshow("gradient", gradxy)

src = cv.imread('E:/imageload/liu.jpg')
cv.namedWindow('input_image', cv.WINDOW_NORMAL) #設置為WINDOW_NORMAL可以任意縮放
cv.imshow('input_image', src)
sobel_demo(src)
cv.waitKey(0)
cv.destroyAllWindows()

運行結果:

 注意:

1.Sobel算子用來計算圖像灰度函數的近似梯度。Sobel算子根據像素點上下、左右鄰點灰度加權差,在邊緣處達到極值這一現象檢測邊緣。對噪聲具有平滑作用,提供較為精確的邊緣方向信息,邊緣定位精度不夠高。當對精度要求不是很高時,是一種較為常用的邊緣檢測方法。

2.Sobel具有平滑和微分的功效。即:Sobel算子先將圖像橫向或縱向平滑,然后再縱向或橫向差分,得到的結果是平滑后的差分結果。

OpenCV的Sobel函數原型為:Sobel(src, ddepth, dx, dy[, dst[, ksize[, scale[, delta[, borderType]]]]]) -> dst

src參數表示輸入需要處理的圖像。

ddepth參數表示輸出圖像深度,針對不同的輸入圖像,輸出目標圖像有不同的深度。

  具體組合如下: 
  src.depth() = CV_8U, 取ddepth =-1/CV_16S/CV_32F/CV_64F (一般源圖像都為CV_8U,為了避免溢出,一般ddepth參數選擇CV_32F)
  src.depth() = CV_16U/CV_16S, 取ddepth =-1/CV_32F/CV_64F 
  src.depth() = CV_32F, 取ddepth =-1/CV_32F/CV_64F 
  src.depth() = CV_64F, 取ddepth = -1/CV_64F 
  注:ddepth =-1時,代表輸出圖像與輸入圖像相同的深度。 

dx參數表示x方向上的差分階數,1或0 。

dy參數表示y 方向上的差分階數,1或0 。

dst參數表示輸出與src相同大小和相同通道數的圖像。

ksize參數表示Sobel算子的大小,必須為1、3、5、7。

scale參數表示縮放導數的比例常數,默認情況下沒有伸縮系數。

delta參數表示一個可選的增量,將會加到最終的dst中,同樣,默認情況下沒有額外的值加到dst中。

borderType表示判斷圖像邊界的模式。這個參數默認值為cv2.BORDER_DEFAULT。

參考:

https://blog.csdn.net/streamchuanxi/article/details/51542141

https://blog.csdn.net/sunny2038/article/details/9170013

Sobel算子原理:https://www.cnblogs.com/lancidie/archive/2011/07/17/2108885.html

2.OpenCV的convertScaleAbs函數使用線性變換轉換輸入數組元素成8位無符號整型。函數原型:convertScaleAbs(src[, dst[, alpha[, beta]]]) -> dst

src參數表示原數組。
dst參數表示輸出數組 ( 深度為 8u)。
alpha參數表示比例因子。
beta參數表示原數組元素按比例縮放后添加的值。

3.OpenCV的addWeighted函數是計算兩個數組的加權和。函數原型:addWeighted(src1, alpha, src2, beta, gamma[, dst[, dtype]]) -> dst

src1參數表示需要加權的第一個輸入數組。

alpha參數表示第一個數組的權重。

src2參數表示第二個輸入數組,它和第一個數組擁有相同的尺寸和通道數。

 beta參數表示第二個數組的權重。

gamma參數表示一個加到權重總和上的標量值。

dst參數表示輸出的數組,它和輸入的兩個數組擁有相同的尺寸和通道數。

dtype參數表示輸出數組的可選深度。當兩個輸入數組具有相同的深度時,這個參數設置為-1(默認值),即等同於src1.depth()。

 

二、Scharr算子

代碼如下:

import cv2 as cv
#Scharr算子(Sobel算子的增強版,效果更突出)
def Scharr_demo(image):
    grad_x = cv.Scharr(image, cv.CV_32F, 1, 0)   #對x求一階導
    grad_y = cv.Scharr(image, cv.CV_32F, 0, 1)   #對y求一階導
    gradx = cv.convertScaleAbs(grad_x)  #用convertScaleAbs()函數將其轉回原來的uint8形式
    grady = cv.convertScaleAbs(grad_y)
    cv.imshow("gradient_x", gradx)  #x方向上的梯度
    cv.imshow("gradient_y", grady)  #y方向上的梯度
    gradxy = cv.addWeighted(gradx, 0.5, grady, 0.5, 0)
    cv.imshow("gradient", gradxy)
src = cv.imread('E:/imageload/liu.jpg')
cv.namedWindow('input_image', cv.WINDOW_NORMAL) #設置為WINDOW_NORMAL可以任意縮放
cv.imshow('input_image', src)
Scharr_demo(src)
cv.waitKey(0)
cv.destroyAllWindows()

運行結果:

注意:

Scharr算子也是計算x或y方向上的圖像差分。OpenCV的Scharr函數原型為:Scharr(src, ddepth, dx, dy[, dst[, scale[, delta[, borderType]]]]) -> dst

參數和Sobel算子的幾乎差不多,意思也一樣,只是沒有ksize大小。

Scharr原理參考:https://www.tony4ai.com/DIP-6-6-%E7%81%B0%E5%BA%A6%E5%9B%BE%E5%83%8F-%E5%9B%BE%E5%83%8F%E5%88%86%E5%89%B2-Scharr%E7%AE%97%E5%AD%90/

 

三、拉普拉斯算子

代碼如下:

import cv2 as cv
#拉普拉斯算子
def Laplace_demo(image):
    dst = cv.Laplacian(image, cv.CV_32F)
    lpls = cv.convertScaleAbs(dst)
    cv.imshow("Laplace_demo", lpls)
src = cv.imread('E:/imageload/liu.jpg')
cv.namedWindow('input_image', cv.WINDOW_NORMAL) #設置為WINDOW_NORMAL可以任意縮放
cv.imshow('input_image', src)
Laplace_demo(src)
cv.waitKey(0)
cv.destroyAllWindows()

運行結果:

注意:

1.拉普拉斯算子(Laplace Operator)是n維歐幾里德空間中的一個二階微分算子,定義為梯度(▽f)的散度(▽·f)。

2.OpenCV的Laplacian函數原型為:Laplacian(src, ddepth[, dst[, ksize[, scale[, delta[, borderType]]]]]) -> dst

src參數表示輸入需要處理的圖像。

ddepth參數表示輸出圖像深度,針對不同的輸入圖像,輸出目標圖像有不同的深度。

  具體組合如下: 
  src.depth() = CV_8U, 取ddepth =-1/CV_16S/CV_32F/CV_64F (一般源圖像都為CV_8U,為了避免溢出,一般ddepth參數選擇CV_32F)
  src.depth() = CV_16U/CV_16S, 取ddepth =-1/CV_32F/CV_64F 
  src.depth() = CV_32F, 取ddepth =-1/CV_32F/CV_64F 
  src.depth() = CV_64F, 取ddepth = -1/CV_64F 
  注:ddepth =-1時,代表輸出圖像與輸入圖像相同的深度。 

dst參數表示輸出與src相同大小和相同通道數的圖像。

ksize參數表示用於計算二階導數濾波器的孔徑大小,大小必須是正數和奇數。

scale參數表示計算拉普拉斯算子值的比例因子,默認情況下沒有伸縮系數。

delta參數表示一個可選的增量,將會加到最終的dst中,同樣,默認情況下沒有額外的值加到dst中。

borderType表示判斷圖像邊界的模式。這個參數默認值為cv2.BORDER_DEFAULT。

補:

這里ksize參數默認值為1,此時Laplacian()函數采用以下3x3的孔徑:

                                             

 


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM