一、圖像梯度
圖像梯度可以把圖像看成二維離散函數,圖像梯度其實就是這個二維離散函數的求導。
推文:【OpenCV入門教程之十二】OpenCV邊緣檢測:Canny算子,Sobel算子,Laplace算子,Scharr濾波器合輯
二、Sobel算子
1、介紹
Sobel算子是普通一階差分,是基於尋找梯度強度。
Sobel算子用來計算圖像灰度函數的近似梯度。Sobel算子根據像素點上下、左右鄰點灰度加權差,在邊緣處達到極值這一現象檢測邊緣。對噪聲具有平滑作用,提供較為精確的邊緣方向信息,邊緣定位精度不夠高。當對精度要求不是很高時,是一種較為常用的邊緣檢測方法。
Sobel具有平滑和微分的功效。即:Sobel算子先將圖像橫向或縱向平滑,然后再縱向或橫向差分,得到的結果是平滑后的差分結果。
2、函數
(1)Sobel
def Sobel(src, ddepth, dx, dy, dst=None, ksize=None, scale=None, delta=None, borderType=None): # real signature unknown; restored from __doc__
src參數表示輸入需要處理的圖像。
ddepth參數表示輸出圖像深度,針對不同的輸入圖像,輸出目標圖像有不同的深度。
具體組合如下:
src.depth() = CV_8U, 取ddepth =-1/CV_16S/CV_32F/CV_64F (一般源圖像都為CV_8U,為了避免溢出,一般ddepth參數選擇CV_32F)
src.depth() = CV_16U/CV_16S, 取ddepth =-1/CV_32F/CV_64F
src.depth() = CV_32F, 取ddepth =-1/CV_32F/CV_64F
src.depth() = CV_64F, 取ddepth = -1/CV_64F
注:ddepth =-1時,代表輸出圖像與輸入圖像相同的深度。
dx參數表示x方向上的差分階數,1或0 。
dy參數表示y 方向上的差分階數,1或0 。
dst參數表示輸出與src相同大小和相同通道數的圖像。
ksize參數表示Sobel算子的大小,必須為1、3、5、7。
scale參數表示縮放導數的比例常數,默認情況下沒有伸縮系數。
delta參數表示一個可選的增量,將會加到最終的dst中,同樣,默認情況下沒有額外的值加到dst中。
borderType表示判斷圖像邊界的模式。這個參數默認值為cv2.BORDER_DEFAULT。
(2)convertScalAbs
def convertScaleAbs(src, dst=None, alpha=None, beta=None): # real signature unknown; restored from __doc__
OpenCV的convertScaleAbs函數使用線性變換轉換輸入數組元素成8位無符號整型。函數原型:convertScaleAbs(src[, dst[, alpha[, beta]]]) -> dst
src參數表示原數組。
dst參數表示輸出數組 (深度為 8u)。
alpha參數表示比例因子。
beta參數表示原數組元素按比例縮放后添加的值。
(3)addWeighted
def addWeighted(src1, alpha, src2, beta, gamma, dst=None, dtype=None): # real signature unknown; restored from __doc__
OpenCV的addWeighted函數是計算兩個數組的加權和。函數原型:addWeighted(src1, alpha, src2, beta, gamma[, dst[, dtype]]) -> dst
src1參數表示需要加權(乘以權重再相加)的第一個輸入數組。
alpha參數表示第一個數組的權重。
src2參數表示第二個輸入數組,它和第一個數組擁有相同的尺寸和通道數。
beta參數表示第二個數組的權重。
gamma參數表示一個加到權重總和上的標量值。
dst參數表示輸出的數組,它和輸入的兩個數組擁有相同的尺寸和通道數。
dtype參數表示輸出數組的可選深度。當兩個輸入數組具有相同的深度時,這個參數設置為-1(默認值),即等同於src1.depth()。
3、代碼實現
1 import cv2 as cv 2 def sobel(image): 3 # 獲取x軸方向的梯度,對x求一階導,一般圖像都是256,CV_8U但是由於需要進行計算,為了避免溢出,所以我們選擇CV_32F 4 grad_x = cv.Sobel(image,cv.CV_32F,1,0) 5 # 獲取x軸方向的梯度,對x求一階導 6 grad_y = cv.Sobel(image,cv.CV_32F,0,1) 7 8 # 用convertScaleAbs()函數將其轉回原來的uint8形式,轉絕對值(轉為單通道,0-255) 9 gradx = cv.convertScaleAbs(grad_x) 10 grady = cv.convertScaleAbs(grad_y) 11 12 cv.imshow('gradient-x',gradx) 13 cv.imshow('gradient-y',grady) 14 15 # 圖片融合 16 #gradx權重0.5,grady權重0.5,加權和之后,加gamma=0 17 gradxy = cv.addWeighted(gradx,0.5,grady,0.5,0) 18 cv.imshow('gradient',gradxy) 19 img = cv.imread('1.jpg') 20 cv.imshow('input',img) 21 sobel(img) 22 cv.waitKey(0) 23 cv.destroyAllWindows()
4、在sobel算子的基礎上還有一種Scharr算子,可以獲取更強的邊緣檢測(噪聲比較敏感,需要降噪)
1 grad_x = cv.Scharr(image,cv.CV_32F,1,0) #獲取x軸方向的梯度,對x求一階導,一般圖像都是256,CV_8U但是由於需要進行計算,為了避免溢出,所以我們選擇CV_32F 2 grad_y = cv.Scharr(image, cv.CV_32F, 0,1) # 獲取y軸方向的梯度,對y求一階導
三、拉普拉斯算子
拉普拉斯算子(二階差分)是基於過零點檢測。通過計算梯度,設置閥值,得到邊緣圖像。
1、函數
(1)Laplacian方法
def Laplacian(src, ddepth, dst=None, ksize=None, scale=None, delta=None, borderType=None): # real signature unknown; restored from __doc__
src參數表示輸入需要處理的圖像。
ddepth參數表示輸出圖像深度,針對不同的輸入圖像,輸出目標圖像有不同的深度。
具體組合如下:
src.depth() = CV_8U, 取ddepth =-1/CV_16S/CV_32F/CV_64F (一般源圖像都為CV_8U,為了避免溢出,一般ddepth參數選擇CV_32F)
src.depth() = CV_16U/CV_16S, 取ddepth =-1/CV_32F/CV_64F
src.depth() = CV_32F, 取ddepth =-1/CV_32F/CV_64F
src.depth() = CV_64F, 取ddepth = -1/CV_64F
注:ddepth =-1時,代表輸出圖像與輸入圖像相同的深度。
dst參數表示輸出與src相同大小和相同通道數的圖像。
ksize參數表示用於計算二階導數濾波器的孔徑大小,大小必須是正數和奇數。
- 可以通過修改ksize大小來修改算子,ksize默認是1
- 3是8卷積核,可以向上加,邊緣梯度檢測越明顯 (就是將-4變成-8就成了8卷積核)
scale參數表示計算拉普拉斯算子值的比例因子,默認情況下沒有伸縮系數。
delta參數表示一個可選的增量,將會加到最終的dst中,同樣,默認情況下沒有額外的值加到dst中。
borderType表示判斷圖像邊界的模式。這個參數默認值為cv2.BORDER_DEFAULT。
2、代碼實現
1 def lpls(image): 2 dst = cv.Laplacian(image,cv.CV_32F) 3 la = cv.convertScaleAbs(dst) 4 cv.imshow('lapulasi',la) 5 img = cv.imread('1.jpg') 6 cv.imshow('input',img) 7 lpls(img) 8 cv.waitKey(0) 9 cv.destroyAllWindows()
補充:用自己的卷積核
1 def lapalian_demo(image): 2 kernel = np.array([[0,1,0],[1,-4,1],[0,1,0]]) #卷積核 3 dst = cv.filter2D(image,cv.CV_32F,kernel) #使用4卷積核算子去處理(是Laplacian默認) 4 lpls = cv.convertScaleAbs(dst) 5 cv.imshow("lapalian_demo", lpls)
kernel = np.array([[1,1,1],[1,-8,1],[1,1,1]]) #使用8卷積核處理,增強了