圖像梯度
推文:【OpenCV入門教程之十二】OpenCV邊緣檢測:Canny算子,Sobel算子,Laplace算子,Scharr濾波器合輯
圖像梯度可以把圖像看成二維離散函數,圖像梯度其實就是這個二維離散函數的求導。
Sobel算子是普通一階差分,是基於尋找梯度強度。
拉普拉斯算子(二階差分)是基於過零點檢測。通過計算梯度,設置閥值,得到邊緣圖像。
一:sobel算子
def sobel_demo(image): grad_x = cv.Sobel(image,cv.CV_32F,1,0) #獲取x軸方向的梯度,對x求一階導,一般圖像都是256,CV_8U但是由於需要進行計算,為了避免溢出,所以我們選擇CV_32F grad_y = cv.Sobel(image, cv.CV_32F, 0,1) # 獲取y軸方向的梯度,對y求一階導 gradx = cv.convertScaleAbs(grad_x) #用convertScaleAbs()函數將其轉回原來的uint8形式,轉絕對值 (轉為單通道,0-255) grady = cv.convertScaleAbs(grad_y) cv.imshow("gradient-x",gradx) cv.imshow("gradient-y",grady) gradxy = cv.addWeighted(gradx,0.5,grady,0.5,0) #圖片融合 cv.imshow("gradient",gradxy)
補充:在sobel算子的基礎上還有一種Scharr算子,可以獲取更強的邊緣檢測(噪聲比較敏感,需要降噪)
grad_x = cv.Scharr(image,cv.CV_32F,1,0) #獲取x軸方向的梯度,對x求一階導,一般圖像都是256,CV_8U但是由於需要進行計算,為了避免溢出,所以我們選擇CV_32F grad_y = cv.Scharr(image, cv.CV_32F, 0,1) # 獲取y軸方向的梯度,對y求一階導
相關知識補充:
(一)Sobel算子
Sobel算子用來計算圖像灰度函數的近似梯度。Sobel算子根據像素點上下、左右鄰點灰度加權差,在邊緣處達到極值這一現象檢測邊緣。對噪聲具有平滑作用,提供較為精確的邊緣方向信息,邊緣定位精度不夠高。當對精度要求不是很高時,是一種較為常用的邊緣檢測方法。
Sobel具有平滑和微分的功效。即:Sobel算子先將圖像橫向或縱向平滑,然后再縱向或橫向差分,得到的結果是平滑后的差分結果。
def Sobel(src, ddepth, dx, dy, dst=None, ksize=None, scale=None, delta=None, borderType=None): # real signature unknown; restored from __doc__
src參數表示輸入需要處理的圖像。 ddepth參數表示輸出圖像深度,針對不同的輸入圖像,輸出目標圖像有不同的深度。 具體組合如下: src.depth() = CV_8U, 取ddepth =-1/CV_16S/CV_32F/CV_64F (一般源圖像都為CV_8U,為了避免溢出,一般ddepth參數選擇CV_32F) src.depth() = CV_16U/CV_16S, 取ddepth =-1/CV_32F/CV_64F src.depth() = CV_32F, 取ddepth =-1/CV_32F/CV_64F src.depth() = CV_64F, 取ddepth = -1/CV_64F 注:ddepth =-1時,代表輸出圖像與輸入圖像相同的深度。 dx參數表示x方向上的差分階數,1或0 。 dy參數表示y 方向上的差分階數,1或0 。 dst參數表示輸出與src相同大小和相同通道數的圖像。 ksize參數表示Sobel算子的大小,必須為1、3、5、7。 scale參數表示縮放導數的比例常數,默認情況下沒有伸縮系數。 delta參數表示一個可選的增量,將會加到最終的dst中,同樣,默認情況下沒有額外的值加到dst中。 borderType表示判斷圖像邊界的模式。這個參數默認值為cv2.BORDER_DEFAULT。
(二)convertScaleAbs
def convertScaleAbs(src, dst=None, alpha=None, beta=None): # real signature unknown; restored from __doc__
OpenCV的convertScaleAbs函數使用線性變換轉換輸入數組元素成8位無符號整型。函數原型:convertScaleAbs(src[, dst[, alpha[, beta]]]) -> dst src參數表示原數組。 dst參數表示輸出數組 (深度為 8u)。 alpha參數表示比例因子。 beta參數表示原數組元素按比例縮放后添加的值。
(三)addWeighted
def addWeighted(src1, alpha, src2, beta, gamma, dst=None, dtype=None): # real signature unknown; restored from __doc__
OpenCV的addWeighted函數是計算兩個數組的加權和。函數原型:addWeighted(src1, alpha, src2, beta, gamma[, dst[, dtype]]) -> dst src1參數表示需要加權的第一個輸入數組。 alpha參數表示第一個數組的權重。 src2參數表示第二個輸入數組,它和第一個數組擁有相同的尺寸和通道數。 beta參數表示第二個數組的權重。 gamma參數表示一個加到權重總和上的標量值。 dst參數表示輸出的數組,它和輸入的兩個數組擁有相同的尺寸和通道數。 dtype參數表示輸出數組的可選深度。當兩個輸入數組具有相同的深度時,這個參數設置為-1(默認值),即等同於src1.depth()。
二:拉普拉斯算子
def lapalian_demo(image): dst = cv.Laplacian(image, cv.CV_32F) lpls = cv.convertScaleAbs(dst) cv.imshow("lapalian_demo", lpls)
補充:自己修改拉普拉斯算子
def lapalian_demo(image): kernel = np.array([[0,1,0],[1,-4,1],[0,1,0]]) #卷積核 dst = cv.filter2D(image,cv.CV_32F,kernel) #使用4卷積核算子去處理(是Laplacian默認) lpls = cv.convertScaleAbs(dst) cv.imshow("lapalian_demo", lpls)
kernel = np.array([[1,1,1],[1,-8,1],[1,1,1]]) #使用8卷積核處理,增強了
相關知識補充
(一)Laplacian方法
def Laplacian(src, ddepth, dst=None, ksize=None, scale=None, delta=None, borderType=None): # real signature unknown; restored from __doc__
src參數表示輸入需要處理的圖像。 ddepth參數表示輸出圖像深度,針對不同的輸入圖像,輸出目標圖像有不同的深度。 具體組合如下: src.depth() = CV_8U, 取ddepth =-1/CV_16S/CV_32F/CV_64F (一般源圖像都為CV_8U,為了避免溢出,一般ddepth參數選擇CV_32F) src.depth() = CV_16U/CV_16S, 取ddepth =-1/CV_32F/CV_64F src.depth() = CV_32F, 取ddepth =-1/CV_32F/CV_64F src.depth() = CV_64F, 取ddepth = -1/CV_64F 注:ddepth =-1時,代表輸出圖像與輸入圖像相同的深度。 dst參數表示輸出與src相同大小和相同通道數的圖像。 ksize參數表示用於計算二階導數濾波器的孔徑大小,大小必須是正數和奇數。,可以通過修改ksize大小來修改算子,ksize默認是1,為4卷積核,3是8卷積核,可以向上加,邊緣梯度檢測越明顯 scale參數表示計算拉普拉斯算子值的比例因子,默認情況下沒有伸縮系數。 delta參數表示一個可選的增量,將會加到最終的dst中,同樣,默認情況下沒有額外的值加到dst中。 borderType表示判斷圖像邊界的模式。這個參數默認值為cv2.BORDER_DEFAULT。