十四 圖像梯度


一、圖像梯度

圖像梯度可以把圖像看成二維離散函數,圖像梯度其實就是這個二維離散函數的求導。

推文:【OpenCV入門教程之十二】OpenCV邊緣檢測:Canny算子,Sobel算子,Laplace算子,Scharr濾波器合輯

二、Sobel算子

1、介紹

Sobel算子是普通一階差分,是基於尋找梯度強度。

Sobel算子用來計算圖像灰度函數的近似梯度。Sobel算子根據像素點上下、左右鄰點灰度加權差,在邊緣處達到極值這一現象檢測邊緣。對噪聲具有平滑作用,提供較為精確的邊緣方向信息,邊緣定位精度不夠高。當對精度要求不是很高時,是一種較為常用的邊緣檢測方法。

Sobel具有平滑和微分的功效。即:Sobel算子先將圖像橫向或縱向平滑,然后再縱向或橫向差分,得到的結果是平滑后的差分結果。

2、函數

(1)Sobel

def Sobel(src, ddepth, dx, dy, dst=None, ksize=None, scale=None, delta=None, borderType=None): # real signature unknown; restored from __doc__

src參數表示輸入需要處理的圖像。

ddepth參數表示輸出圖像深度,針對不同的輸入圖像,輸出目標圖像有不同的深度。

  具體組合如下:
  src.depth() = CV_8U, 取ddepth =-1/CV_16S/CV_32F/CV_64F (一般源圖像都為CV_8U,為了避免溢出,一般ddepth參數選擇CV_32F)
  src.depth() = CV_16U/CV_16S, 取ddepth =-1/CV_32F/CV_64F
  src.depth() = CV_32F, 取ddepth =-1/CV_32F/CV_64F
  src.depth() = CV_64F, 取ddepth = -1/CV_64F
  注:ddepth =-1時,代表輸出圖像與輸入圖像相同的深度。

dx參數表示x方向上的差分階數,1或0 。

dy參數表示y 方向上的差分階數,1或0 。

dst參數表示輸出與src相同大小和相同通道數的圖像。

ksize參數表示Sobel算子的大小,必須為1、3、5、7。

scale參數表示縮放導數的比例常數,默認情況下沒有伸縮系數。

delta參數表示一個可選的增量,將會加到最終的dst中,同樣,默認情況下沒有額外的值加到dst中。

borderType表示判斷圖像邊界的模式。這個參數默認值為cv2.BORDER_DEFAULT。

(2)convertScalAbs

def convertScaleAbs(src, dst=None, alpha=None, beta=None): # real signature unknown; restored from __doc__

OpenCV的convertScaleAbs函數使用線性變換轉換輸入數組元素成8位無符號整型。函數原型:convertScaleAbs(src[, dst[, alpha[, beta]]]) -> dst

src參數表示原數組。
dst參數表示輸出數組 (深度為 8u)。
alpha參數表示比例因子。
beta參數表示原數組元素按比例縮放后添加的值。

(3)addWeighted

def addWeighted(src1, alpha, src2, beta, gamma, dst=None, dtype=None): # real signature unknown; restored from __doc__

OpenCV的addWeighted函數是計算兩個數組的加權和。函數原型:addWeighted(src1, alpha, src2, beta, gamma[, dst[, dtype]]) -> dst

src1參數表示需要加權(乘以權重再相加)的第一個輸入數組。

alpha參數表示第一個數組的權重。

src2參數表示第二個輸入數組,它和第一個數組擁有相同的尺寸和通道數。

 beta參數表示第二個數組的權重。

gamma參數表示一個加到權重總和上的標量值。

dst參數表示輸出的數組,它和輸入的兩個數組擁有相同的尺寸和通道數。

dtype參數表示輸出數組的可選深度。當兩個輸入數組具有相同的深度時,這個參數設置為-1(默認值),即等同於src1.depth()。

 3、代碼實現

 1 import cv2 as cv
 2 def sobel(image):
 3     # 獲取x軸方向的梯度,對x求一階導,一般圖像都是256,CV_8U但是由於需要進行計算,為了避免溢出,所以我們選擇CV_32F
 4     grad_x = cv.Sobel(image,cv.CV_32F,1,0)
 5     # 獲取x軸方向的梯度,對x求一階導
 6     grad_y = cv.Sobel(image,cv.CV_32F,0,1)
 7 
 8     # 用convertScaleAbs()函數將其轉回原來的uint8形式,轉絕對值(轉為單通道,0-255)
 9     gradx = cv.convertScaleAbs(grad_x)
10     grady = cv.convertScaleAbs(grad_y)
11 
12     cv.imshow('gradient-x',gradx)
13     cv.imshow('gradient-y',grady)
14 
15     # 圖片融合
16     #gradx權重0.5,grady權重0.5,加權和之后,加gamma=0
17     gradxy = cv.addWeighted(gradx,0.5,grady,0.5,0)
18     cv.imshow('gradient',gradxy)
19 img = cv.imread('1.jpg')
20 cv.imshow('input',img)
21 sobel(img)
22 cv.waitKey(0)
23 cv.destroyAllWindows()

4、在sobel算子的基礎上還有一種Scharr算子,可以獲取更強的邊緣檢測(噪聲比較敏感,需要降噪)

1 grad_x = cv.Scharr(image,cv.CV_32F,1,0) #獲取x軸方向的梯度,對x求一階導,一般圖像都是256,CV_8U但是由於需要進行計算,為了避免溢出,所以我們選擇CV_32F
2 grad_y = cv.Scharr(image, cv.CV_32F, 0,1)  # 獲取y軸方向的梯度,對y求一階導

三、拉普拉斯算子

拉普拉斯算子(二階差分)是基於過零點檢測。通過計算梯度,設置閥值,得到邊緣圖像。

1、函數

 

(1)Laplacian方法

def Laplacian(src, ddepth, dst=None, ksize=None, scale=None, delta=None, borderType=None): # real signature unknown; restored from __doc__

src參數表示輸入需要處理的圖像。

ddepth參數表示輸出圖像深度,針對不同的輸入圖像,輸出目標圖像有不同的深度。

  具體組合如下:
  src.depth() = CV_8U, 取ddepth =-1/CV_16S/CV_32F/CV_64F (一般源圖像都為CV_8U,為了避免溢出,一般ddepth參數選擇CV_32F)
  src.depth() = CV_16U/CV_16S, 取ddepth =-1/CV_32F/CV_64F
  src.depth() = CV_32F, 取ddepth =-1/CV_32F/CV_64F
  src.depth() = CV_64F, 取ddepth = -1/CV_64F
  注:ddepth =-1時,代表輸出圖像與輸入圖像相同的深度。

dst參數表示輸出與src相同大小和相同通道數的圖像。

ksize參數表示用於計算二階導數濾波器的孔徑大小,大小必須是正數和奇數。

  • 可以通過修改ksize大小來修改算子,ksize默認是1 

     

  • 3是8卷積核,可以向上加,邊緣梯度檢測越明顯  (就是將-4變成-8就成了8卷積核)


scale參數表示計算拉普拉斯算子值的比例因子,默認情況下沒有伸縮系數。

delta參數表示一個可選的增量,將會加到最終的dst中,同樣,默認情況下沒有額外的值加到dst中。

borderType表示判斷圖像邊界的模式。這個參數默認值為cv2.BORDER_DEFAULT。

 2、代碼實現

1 def lpls(image):
2     dst = cv.Laplacian(image,cv.CV_32F)
3     la = cv.convertScaleAbs(dst)
4     cv.imshow('lapulasi',la)
5 img = cv.imread('1.jpg')
6 cv.imshow('input',img)
7 lpls(img)
8 cv.waitKey(0)
9 cv.destroyAllWindows()

補充:用自己的卷積核

1 def lapalian_demo(image):
2     kernel = np.array([[0,1,0],[1,-4,1],[0,1,0]])  #卷積核
3     dst = cv.filter2D(image,cv.CV_32F,kernel)  #使用4卷積核算子去處理(是Laplacian默認)
4     lpls = cv.convertScaleAbs(dst)
5     cv.imshow("lapalian_demo", lpls)
kernel = np.array([[1,1,1],[1,-8,1],[1,1,1]])  #使用8卷積核處理,增強了

 


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM