Python OpenCV 圖像相識度對比


強大的openCV能做什么我就不啰嗦,你能想到的一切圖像+視頻處理.

這里,我們說說openCV的圖像相似度對比, 嗯,說好聽一點那叫圖像識別,但嚴格講, 圖像識別是在一個圖片中進行類聚處理,比如圖片人臉識別,眼部識別,但相識度對比是指兩個或兩個以上的圖片進行對比相似度.

先來幾張圖片

(a.png)     (a_cp.png)      (t1.png)        (t2.png)

其中,a_cp.png 是復制a.png,也就是說是同一個圖片, t1.png 與t2.png 看起來相同,但都是通過PIL裁剪的圖片,可以認為相似但不相同. 

我們先通過下面幾個方法判斷圖片是否相同

operator對圖片對象進行對比

operator.eq(a,b) 判斷a,b 對象是否相同

import operator
from PIL import Image


a=Image.open("a.png")
a_cp=Image.open("a_cp.png")

t1=Image.open("t1.png")
t2=Image.open("t2.png")


c=operator.eq(a,a_cp)
e=operator.eq(t1,t2)
print(c)
print(e)

打印結果 c為True, e為False

numpy.subtract對圖片對象進行對比

import numpy as np
from PIL import Image

a = Image.open("a.png")
a_cp = Image.open("a_cp.png")

t1 = Image.open("t1.png")
t2 = Image.open("t2.png")

difference = np.subtract(a, a_cp)  # 判斷imgv 與v 的差值,存在差值,表示不相同
c = not np.any(difference)  # np.any 滿足一個1即為真, (圖片相同差值為0,np.any為false, not fasle 即為真認為存在相同的圖片)

difference = np.subtract(t1, t2)
e = not np.any(difference)

print(c)
print(e)

打印結果 c為True, e為False

 

hashlib.md5對圖片對象進行對比

import hashlib

a = open("a.png","rb")
a_cp = open("a_cp.png",'rb')

t1 = open("t1.png",'rb')
t2 = open("t2.png",'rb')

cmd5=hashlib.md5(a.read()).hexdigest()
ccmd5=hashlib.md5(a_cp.read()).hexdigest()

emd5=hashlib.md5(t1.read()).hexdigest()
eecmd5=hashlib.md5(t2.read()).hexdigest()

print(cmd5)
if cmd5==ccmd5:
    print(True)
else:
    print(False)

print(emd5)
if emd5==eecmd5:
    print(True)
else:
    print(False)

打印文件md5結果:

928f9df2d83fa5656bbd0f228c8f5f46
True
bff71ccd5d2c85fb0730c2ada678feea
False

 由 operator.eq  與 numpy.subtract   和 hashlib.md5 方法發現,這些方法得出的結論,要不相同,要不不相同,世界萬物皆如此.

說的好! 你給我的是boolean值,我不要,不要,不......

我們想要的就是得到兩個圖片的相似值,某些場景,我們需要這樣的值, 比如探頭監控中的人與真人照片對比,因受到距離, 分辨率,移動速度等影響,相同的人有可能無法准確辨認,在比如,連連看中的小方塊,通過PIL裁剪后,相同的圖像圖片因灰度,尺寸大小不同我們會認為相同的圖片以上三個方法就返回False. 因此openCV更適合這種百分比的相似度計算.

之前用過sklearn 的 Linear Regression 做過線性回歸的數據預處理計算概率,因數據量小,未做到樣本訓練,突發奇想,如果openCV能結合sklearn的機器學習,給一堆圖片,經過fit樣本訓練獲取圖片的各種特征,隨便給一張圖片,然后便能知道圖片來自那個地方,拍攝時間,都有哪些人物...

回來,回來... 我們繼續說openCV相識度問題.

 一般通過三種哈希算法與灰度直方圖算法進行判斷

 

均值哈希算法

#均值哈希算法
def aHash(img):
    #縮放為8*8
    img=cv2.resize(img,(8,8))
    #轉換為灰度圖
    gray=cv2.cvtColor(img,cv2.COLOR_BGR2GRAY)
    #s為像素和初值為0,hash_str為hash值初值為''
    s=0
    hash_str=''
    #遍歷累加求像素和
    for i in range(8):
        for j in range(8):
            s=s+gray[i,j]
    #求平均灰度
    avg=s/64
    #灰度大於平均值為1相反為0生成圖片的hash值
    for i in range(8):
        for j in range(8):
            if  gray[i,j]>avg:
                hash_str=hash_str+'1'
            else:
                hash_str=hash_str+'0'
    return hash_str

 

差值哈希算法

def dHash(img):
    #縮放8*8
    img=cv2.resize(img,(9,8))
    #轉換灰度圖
    gray=cv2.cvtColor(img,cv2.COLOR_BGR2GRAY)
    hash_str=''
    #每行前一個像素大於后一個像素為1,相反為0,生成哈希
    for i in range(8):
        for j in range(8):
            if   gray[i,j]>gray[i,j+1]:
                hash_str=hash_str+'1'
            else:
                hash_str=hash_str+'0'
    return hash_str

 

感知哈希算法

def pHash(img):
    #縮放32*32
    img = cv2.resize(img, (32, 32))   # , interpolation=cv2.INTER_CUBIC

    # 轉換為灰度圖
    gray = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY)
    # 將灰度圖轉為浮點型,再進行dct變換
    dct = cv2.dct(np.float32(gray))
    #opencv實現的掩碼操作
    dct_roi = dct[0:8, 0:8]



    hash = []
    avreage = np.mean(dct_roi)
    for i in range(dct_roi.shape[0]):
        for j in range(dct_roi.shape[1]):
            if dct_roi[i, j] > avreage:
                hash.append(1)
            else:
                hash.append(0)
    return hash

 

灰度直方圖算法

# 計算單通道的直方圖的相似值
def calculate(image1, image2):
    hist1 = cv2.calcHist([image1], [0], None, [256], [0.0, 255.0])
    hist2 = cv2.calcHist([image2], [0], None, [256], [0.0, 255.0])
    # 計算直方圖的重合度
    degree = 0
    for i in range(len(hist1)):
        if hist1[i] != hist2[i]:
            degree = degree + (1 - abs(hist1[i] - hist2[i]) / max(hist1[i], hist2[i]))
        else:
            degree = degree + 1
    degree = degree / len(hist1)
    return degree
RGB每個通道的直方圖計算相似度
def classify_hist_with_split(image1, image2, size=(256, 256)):
    # 將圖像resize后,分離為RGB三個通道,再計算每個通道的相似值
    image1 = cv2.resize(image1, size)
    image2 = cv2.resize(image2, size)
    sub_image1 = cv2.split(image1)
    sub_image2 = cv2.split(image2)
    sub_data = 0
    for im1, im2 in zip(sub_image1, sub_image2):
        sub_data += calculate(im1, im2)
    sub_data = sub_data / 3
    return sub_data

 

啥? 

我為什么知道這三個哈希算法和通道直方圖計算方法,嗯, 我也是從網上查的.

上素材

(x1y2.png)    (x2y4.png)     (x2y6.png)        (t1.png)         (t2.png)      (t3.png)

 

完整代碼:

import cv2
import numpy as np


# 均值哈希算法
def aHash(img):
    # 縮放為8*8
    img = cv2.resize(img, (8, 8))
    # 轉換為灰度圖
    gray = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY)
    # s為像素和初值為0,hash_str為hash值初值為''
    s = 0
    hash_str = ''
    # 遍歷累加求像素和
    for i in range(8):
        for j in range(8):
            s = s + gray[i, j]
    # 求平均灰度
    avg = s / 64
    # 灰度大於平均值為1相反為0生成圖片的hash值
    for i in range(8):
        for j in range(8):
            if gray[i, j] > avg:
                hash_str = hash_str + '1'
            else:
                hash_str = hash_str + '0'
    return hash_str


# 差值感知算法
def dHash(img):
    # 縮放8*8
    img = cv2.resize(img, (9, 8))
    # 轉換灰度圖
    gray = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY)
    hash_str = ''
    # 每行前一個像素大於后一個像素為1,相反為0,生成哈希
    for i in range(8):
        for j in range(8):
            if gray[i, j] > gray[i, j + 1]:
                hash_str = hash_str + '1'
            else:
                hash_str = hash_str + '0'
    return hash_str


# 感知哈希算法(pHash)
def pHash(img):
    # 縮放32*32
    img = cv2.resize(img, (32, 32))  # , interpolation=cv2.INTER_CUBIC

    # 轉換為灰度圖
    gray = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY)
    # 將灰度圖轉為浮點型,再進行dct變換
    dct = cv2.dct(np.float32(gray))
    # opencv實現的掩碼操作
    dct_roi = dct[0:8, 0:8]

    hash = []
    avreage = np.mean(dct_roi)
    for i in range(dct_roi.shape[0]):
        for j in range(dct_roi.shape[1]):
            if dct_roi[i, j] > avreage:
                hash.append(1)
            else:
                hash.append(0)
    return hash


# 通過得到RGB每個通道的直方圖來計算相似度
def classify_hist_with_split(image1, image2, size=(256, 256)):
    # 將圖像resize后,分離為RGB三個通道,再計算每個通道的相似值
    image1 = cv2.resize(image1, size)
    image2 = cv2.resize(image2, size)
    sub_image1 = cv2.split(image1)
    sub_image2 = cv2.split(image2)
    sub_data = 0
    for im1, im2 in zip(sub_image1, sub_image2):
        sub_data += calculate(im1, im2)
    sub_data = sub_data / 3
    return sub_data


# 計算單通道的直方圖的相似值
def calculate(image1, image2):
    hist1 = cv2.calcHist([image1], [0], None, [256], [0.0, 255.0])
    hist2 = cv2.calcHist([image2], [0], None, [256], [0.0, 255.0])
    # 計算直方圖的重合度
    degree = 0
    for i in range(len(hist1)):
        if hist1[i] != hist2[i]:
            degree = degree + (1 - abs(hist1[i] - hist2[i]) / max(hist1[i], hist2[i]))
        else:
            degree = degree + 1
    degree = degree / len(hist1)
    return degree


# Hash值對比
def cmpHash(hash1, hash2):
    n = 0
    # hash長度不同則返回-1代表傳參出錯
    if len(hash1)!=len(hash2):
        return -1
    # 遍歷判斷
    for i in range(len(hash1)):
        # 不相等則n計數+1,n最終為相似度
        if hash1[i] != hash2[i]:
            n = n + 1
    return n


img1 = cv2.imread('openpic/x1y2.png')  #  11--- 16 ----13 ---- 0.43
img2 = cv2.imread('openpic/x2y4.png')

img1 = cv2.imread('openpic/x3y5.png')  #  10----11 ----8------0.25
img2 = cv2.imread('openpic/x9y1.png')

img1 = cv2.imread('openpic/x1y2.png')  #  6------5 ----2--------0.84
img2 = cv2.imread('openpic/x2y6.png')

img1 = cv2.imread('openpic/t1.png')  #    14------19---10--------0.70
img2 = cv2.imread('openpic/t2.png')

img1 = cv2.imread('openpic/t1.png')  #    39------33---18--------0.58
img2 = cv2.imread('openpic/t3.png')

hash1 = aHash(img1)
hash2 = aHash(img2)
n = cmpHash(hash1, hash2)
print('均值哈希算法相似度:', n)

hash1 = dHash(img1)
hash2 = dHash(img2)
n = cmpHash(hash1, hash2)
print('差值哈希算法相似度:', n)

hash1 = pHash(img1)
hash2 = pHash(img2)
n = cmpHash(hash1, hash2)
print('感知哈希算法相似度:', n)

n = classify_hist_with_split(img1, img2)
print('三直方圖算法相似度:', n)

 

 

參考:

https://blog.csdn.net/haofan_/article/details/77097473?locationNum=7&fps=1

https://blog.csdn.net/feimengjuan/article/details/51279629

http://www.cnblogs.com/chujian1120/p/5512276.html

https://www.uisdc.com/head-first-histogram-design

 


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM