百度百科:模板匹配是一種最原始、最基本的模式識別方法,研究某一特定對象物的圖案位於圖像的什么地方,進而識別對象物,這就是一個匹配問題。它是圖像處理中最基本、最常用的匹配方法。模板匹配具有自身的局限性,主要表現在它只能進行平行移動,若原圖像中的匹配目標發生旋轉或大小變化,該算法無效。
簡單來說,模板匹配就是在整個圖像區域發現與給定子圖像匹配的小塊區域。
工作原理:在帶檢測圖像上,從左到右,從上向下計算模板圖像與重疊子圖像的匹配度,匹配程度越大,兩者相同的可能性越大。
代碼如下:
#模板匹配 import cv2 as cv import numpy as np def template_demo(): tpl =cv.imread("E:/imageload/sample1.jpg") target = cv.imread("E:/imageload/target1.jpg") cv.namedWindow('template image', cv.WINDOW_NORMAL) cv.imshow("template image", tpl) cv.namedWindow('target image', cv.WINDOW_NORMAL) cv.imshow("target image", target) methods = [cv.TM_SQDIFF_NORMED, cv.TM_CCORR_NORMED, cv.TM_CCOEFF_NORMED] #3種模板匹配方法 th, tw = tpl.shape[:2] for md in methods: print(md) result = cv.matchTemplate(target, tpl, md) min_val, max_val, min_loc, max_loc = cv.minMaxLoc(result) if md == cv.TM_SQDIFF_NORMED: tl = min_loc else: tl = max_loc br = (tl[0]+tw, tl[1]+th) #br是矩形右下角的點的坐標 cv.rectangle(target, tl, br, (0, 0, 255), 2) cv.namedWindow("match-" + np.str(md), cv.WINDOW_NORMAL) cv.imshow("match-" + np.str(md), target) template_demo() cv.waitKey(0) cv.destroyAllWindows()
運行結果:
注意:
1.幾種常見的模板匹配算法:
其中,
①TM_SQDIFF是平方差匹配;TM_SQDIFF_NORMED是標准平方差匹配。利用平方差來進行匹配,最好匹配為0.匹配越差,匹配值越大。
②TM_CCORR是相關性匹配;TM_CCORR_NORMED是標准相關性匹配。采用模板和圖像間的乘法操作,數越大表示匹配程度較高, 0表示最壞的匹配效果。
③TM_CCOEFF是相關性系數匹配;TM_CCOEFF_NORMED是標准相關性系數匹配。將模版對其均值的相對值與圖像對其均值的相關值進行匹配,1表示完美匹配,-1表示糟糕的匹配,0表示沒有任何相關性(隨機序列)。
總結:隨着從簡單的測量(平方差)到更復雜的測量(相關系數),我們可獲得越來越准確的匹配(同時也意味着越來越大的計算代價)。
參考:
https://blog.csdn.net/guduruyu/article/details/69231259
補:個人認為參考的第一篇博客的關於模板匹配算法的原理有一點點點錯誤,模板圖像應該是左上角開始,而不是從中心點開始。在左上角那個點開始計算匹配度,最后得出的最匹配的坐標點是模板圖像左上角的位置(純屬個人覺得,如有錯誤,歡迎指出來)。
我認為模板匹配原理應該如下:
2.opencv的目標匹配函數為matchTemplate,函數原型為:matchTemplate(image, templ, method[, result[, mask]]) -> result
image參數表示待搜索源圖像,必須是8位整數或32位浮點。
templ參數表示模板圖像,必須不大於源圖像並具有相同的數據類型。
method參數表示計算匹配程度的方法。
result參數表示匹配結果圖像,必須是單通道32位浮點。如果image的尺寸為W x H,templ的尺寸為w x h,則result的尺寸為(W-w+1)x(H-h+1)。
3.opencv的函數minMaxLoc:在給定的矩陣中尋找最大和最小值,並給出它們的位置。 該功能不適用於多通道陣列。 如果您需要在所有通道中查找最小或最大元素,要先將陣列重新解釋為單通道。
函數minMaxLoc原型為:minMaxLoc(src[, mask]) -> minVal, maxVal, minLoc, maxLoc
src參數表示輸入單通道圖像。
mask參數表示用於選擇子數組的可選掩碼。
minVal參數表示返回的最小值,如果不需要,則使用NULL。
maxVal參數表示返回的最大值,如果不需要,則使用NULL。
minLoc參數表示返回的最小位置的指針(在2D情況下); 如果不需要,則使用NULL。
maxLoc參數表示返回的最大位置的指針(在2D情況下); 如果不需要,則使用NULL。
參考:https://blog.csdn.net/liuqz2009/article/details/60869427
4.opencv的函數rectangle用於繪制矩形。函數原型為: rectangle(img, pt1, pt2, color[, thickness[, lineType[, shift]]]) -> img
img參數表示源圖像。
pt1參數表示矩形的一個頂點。
pt2參數表示與pt1相對的對角線上的另一個頂點 。
color參數表示矩形線條顏色 (RGB) 或亮度(灰度圖像 )。
thickness參數表示組成矩形的線條的粗細程度。取負值時(如 CV_FILLED)函數繪制填充了色彩的矩形。
lineType參數表示線條的類型。
shift參數表示坐標點的小數點位數。