圖像相似度中的Hash算法

本文轉載自查看原文 2019-07-28 20:42 6263 圖像哈希/ dhash/ 機器學習/ 圖像相似度/ phash/ ahash

本博客中使用的代碼見本文末尾

度量兩張圖片的相似度有許多算法，本文講介紹工程領域中最常用的圖片相似度算法之一——Hash算法。Hash算法准確的說有三種，分別為平均哈希算法(aHash)、感知哈希算法你(pHash)和差異哈哈希算法(dHash)。

三種Hash算法都是通過獲取圖片的hash值，再比較兩張圖片hash值的漢明距離(韓明距離的概念可見本公眾號《》一文)來度量兩張圖片是否相似。兩張圖片越相似，那么兩張圖片的hash數的漢明距離越小。下面本文將分別介紹這三種Hash算法。

1 平均哈希算法（aHash）

1.1 算法步驟

平均哈希算法是三種Hash算法中最簡單的一種，它通過下面幾個步驟來獲得圖片的Hash值，這幾個步驟分別是(1) 縮放圖片；（2）轉灰度圖; (3) 算像素均值；（4）根據相似均值計算指紋。具體算法如下所示:

表1 aHash得到圖片Hash值地算法

步驟	具體內容
縮放圖片	輸入圖片大小尺寸各異，為了統一圖片的輸入，統一將圖片尺寸縮放為8*8，一共得到了64個像素點。
轉灰度圖	輸入圖片有些為單通道灰度圖，有些RGB三通道彩色圖，有些為RGBA四通道彩色圖。也為了統一下一步輸入標准，將非單通道圖片都轉為單通道灰度圖。其中RGB三通道轉單通道算法有下面幾種: 1.浮點算法：Gray=R0.3+G0.59+B0.11 2.整數方法：Gray=(R30+G59+B11)/100 3.移位方法：Gray =(R76+G151+B*28)>>8; 4.平均值法：Gray=（R+G+B）/3; 5.僅取綠色：Gray=G；
算像素均值	通過上一步可得一個8x8的整數矩陣G，計算這個矩陣中所有元素的平均值，假設其值為a
據像素均值計算指紋	初始化輸入圖片的ahash = "" 從左到右一行一行地遍歷矩陣G每一個像素如果第i行j列元素G(i,j) >= a，則ahash += "1"如果第i行j列元素G(i,j) <a，則ahash += "0"

得到圖片的ahash值后，比較兩張圖片ahash值的漢明距離，通常認為漢明距離小於10的一組圖片為相似圖片。

1.2 具體實例

本文圖片為Lena圖來說明.

圖1 Lena(Origin)圖

圖2 轉為8x8尺寸的Lena圖

圖3 轉為灰度8x8尺寸的Lena圖

其中轉為8x8尺寸的Lena對應的數據矩陣為:

很容得到如上矩陣所有元素的均值a= 121.328125, 將上述矩陣中大於或等於a的元素置為1, 小於a的元素置為0，可得：

所以可得Lena圖的aHash為

1011111010011110100111011010100110101011101000110000111000101100

將二進制形式ahash轉十六進制hash為

be9e9da9aba30e2c

為了測試aHash算法的效果，我們用一張帶噪聲Lena(noise)圖和與Lena不一樣的Barbara做圖片相似度對比實驗，其中Lena(noise)和Barbara如下:

圖4 Lena(noise)圖

圖5 Barbara圖

通過aHash算法容易得三個圖片的hash值，然后根據hanming距離計算Lena(origin).png和Lena(noise).png Barbar.png之間漢明距離，具體如下:

圖6 aHash算法圖片相似度實驗

由上圖可見aHash能區別相似圖片和差異大的圖片。

2 感知哈希算法（pHash）

2.1 算法步驟

感知哈希算法是三種Hash算法中較為復雜的一種，它是基於DCT（離散余弦變換）來得到圖片的hash值，其算法幾個步驟分別是(1) 縮放圖片；（2）轉灰度圖; (3) 計算DCT；（4）縮小DCT; (5)算平均值；(6) 計算指紋。具體算法如下所示:

表2 pHash得到圖片Hash值地算法

步驟	具體內容
縮放圖片	統一將圖片尺寸縮放為32*32，一共得到了1024個像素點。
轉灰度圖	統一下一步輸入標准，將非單通道圖片都轉為單通道灰度圖。
計算DCT	計算32x32數據矩陣的離散余弦變換后對應的32x32數據矩陣
縮小DCT	取上一步得到32x32數據矩陣左上角8x8子區域
算平均值	通過上一步可得一個8x8的整數矩陣G, 計算這個矩陣中所有元素的平均值，假設其值為a
計算指紋	初始化輸入圖片的phash = "" 從左到右一行一行地遍歷矩陣G每一個像素如果第i行j列元素G(i,j) >= a，則phash += "1" 如果第i行j列元素G(i,j) <a，則phash += "0"

得到圖片的phash值后，比較兩張圖片phash值的漢明距離，通常認為漢明距離小於10的一組圖片為相似圖片。

2.2 具體實例

仍用Lena圖來說明.

圖7 轉為灰度32x32尺寸的Lena圖

圖8 灰度32x32尺寸Lena圖對應的DCT矩陣

通過計算可得灰度32x32Lenna圖對應的DCT矩陣左上角8x8區域子矩陣為:

很容得到如上矩陣所有元素的均值a= 77.35, 將上述矩陣中大於或等於a的元素置為1, 小於a的元素置為0，可得：

所以可得Lena圖的pHash為

1001100111000100010101000010010101100000001000111000001010000000

將二進制形式phash轉十六進制hash為

99c4542560238280

為了測試pHash算法的效果，同樣用一張帶噪聲Lena(noise)圖和與Lena不一樣的Barbara做圖片相似度對比實驗。通過pHash算法容易得三個圖片的hash值，然后根據hanming距離計算Lena(origin).png和Lena(noise).png Barbar.png之間漢明距離，具體如下:

圖9 pHash算法圖片相似度實驗

由上圖可見pHash能區別相似圖片和差異大的圖片。

3 差異哈希算法（dHash）

3.1 算法步驟

相比pHash，dHash的速度要快的多，相比aHash，dHash在效率幾乎相同的情況下的效果要更好，它是基於漸變實現的。其算法幾個步驟分別是(1) 縮放圖片；（2）轉灰度圖; (3) 算差異值；
(4) 計算指紋。具體算法如下所示:

表3 dHash得到圖片Hash值地算法

步驟	具體內容
小圖片	統一將圖片尺寸縮放為9x8，一共得到了72個像素點
轉灰度圖	統一下一步輸入標准，將非單通道圖片都轉為單通道灰度圖。
算差異值	當前行像素值-前一行像素值，從第二到第九行共8行，又因為矩陣有8列，所以得到一個8x8差分矩陣G
計算指紋	初始化輸入圖片的dhash = "" 從左到右一行一行地遍歷矩陣G每一個像素如果第i行j列元素G(i,j) >= a，則dhash += "1" 如果第i行j列元素G(i,j) <a，則dhash += "0"

得到圖片的phash值后，比較兩張圖片phash值的漢明距離，通常認為漢明距離小於10的一組圖片為相似圖片。

3.2 具體實例

仍用Lena圖來說明.

圖7 轉為灰度9x8尺寸的Lena圖

通過計算可得灰度9x8Lenna圖數據矩陣為:

從第二行開始進行減去前一行操作，可得如下查分矩陣

將上述矩陣中大於或等於0元素置為1, 小於a的元素置為0，可得：

所以可得Lena圖的dHash為

0101100000110111111010000101001001101011101011110001010001010000

將二進制形式dhash轉十六進制hash為

99c4542560238280

為了測試dHash算法的效果，同樣用一張帶噪聲Lena(noise)圖和與Lena不一樣的Barbara做圖片相似度對比實驗。通過pHash算法容易得三個圖片的hash值，然后根據hanming距離計算Lena(origin).png和Lena(noise).png Barbar.png之間漢明距離，具體如下:

圖9 dHash算法圖片相似度實驗

由上圖可見dHash能區別相似圖片和差異大的圖片。

總結

關於圖像相似度算法除了Hash算法，在傳統算法領域中還有基於SIFT的匹配算法，基於Gist特征的匹配算法；在深度學習領域中有基於ResNet全連接的匹配算法。感興趣的讀者可以通過google來了解這些算法。

參考資料

432-Looks-Like-It
529-Kind-of-Like-That

本文代碼

Github代碼

免責聲明！

本站轉載的文章為個人學習借鑒使用，本站對版權不負任何法律責任。如果侵犯了您的隱私權益，請聯系本站郵箱yoyou2525@163.com刪除。

猜您在找 圖像的相似度Hash算法深入學習OpenCV中圖像灰度化原理，圖像相似度的算法計算圖像相似度——《Python也可以》之一 java 圖片相似度算法句子相似度--余弦相似度算法的實現使用余弦相似度算法計算文本相似度計算圖像相似度——《Python也可以》之一(轉) elasticsearch算法之推薦系統的相似度算法(一) ES 相似度算法設置（續） Spark/Scala實現推薦系統中的相似度算法（歐幾里得距離、皮爾遜相關系數、余弦相似度：附實現代碼）