比較圖片的方法
以前傳統的比較方式是遍歷圖片中的每一個像素,然后進行比對。這樣的比對在少量圖片的比對上雖然效率低一點,但是也沒有什么不好。但是在大量圖片比對的時候,過長的反應時間和對服務器比較高的消耗肯定是不行的。
所以微軟給我們提供了另外一種比對的方法,能夠正確,高效的比對出兩張圖片的是否相同。這種方法的原理是:將圖片保存到數據流中然后使用Convert.ToBase64String將數據流轉換為字符串,那么我們只需要比對兩張圖片的字符串就ok了。代碼如下:

1 public bool CheckImg(string filePath1, string filePath2) 2 { 3 4 5 MemoryStream ms1 = new MemoryStream(); 6 Image image1 = Image.FromFile(filePath1); 7 image1.Save(ms1, System.Drawing.Imaging.ImageFormat.Jpeg); 8 9 string img1 = Convert.ToBase64String(ms1.ToArray()); 10 11 Image image2 = Image.FromFile(filePath2); 12 image2.Save(ms1, System.Drawing.Imaging.ImageFormat.Jpeg); 13 string img2 = Convert.ToBase64String(ms1.ToArray()); 14 15 if (img1.Equals(img2)) 16 { 17 return true; 18 } 19 else 20 { 21 return false; 22 } 23 }
這種方法我使用控制台測試了下時間,時間大概為0.015s左右比較一張圖片的時間。還是比較高效的。
大量圖片的比較
比較兩張圖片能夠滿足需求,那么大量呢? 我這邊也做了這種測試的。在450張圖片中,選擇出其中重復的圖片,並展示出來。大概時間是16s左右,基本能夠滿足大部分的需求了。
比較方法是,先講450張圖片,全部一次性轉換為string類型,存放到一個數組里面,這樣就避免了每次循環都要額外的去轉換,使程序的效率降低很多。
1 public static List<Dictionary<string, string>> chekImgss(string filePath) 2 { 3 4 List<Dictionary<string, string>> liststr = new List<Dictionary<string, string>>(); 5 DirectoryInfo dir = new DirectoryInfo(filePath); 6 FileInfo[] files = dir.GetFiles(); 7 foreach (FileInfo fileInfo in files) 8 { 9 Dictionary<string, string> dic = new Dictionary<string, string>(); 10 string ex = fileInfo.Extension; 11 if (ex == ".jpg" || ex == ".png") 12 { 13 MemoryStream ms1 = new MemoryStream(); 14 Image image2 = Image.FromFile(filePath + fileInfo.Name); 15 image2.Save(ms1, System.Drawing.Imaging.ImageFormat.Jpeg); 16 17 string imgBase64 = Convert.ToBase64String(ms1.ToArray()); 18 19 dic["base64"] = imgBase64; 20 dic["imgName"] = fileInfo.Name; 21 liststr.Add(dic); 22 } 23 } 24 25 return liststr; 26 }
將圖片的base64string和圖片的名稱存儲在一個dictionary中,然后存儲到list數組中。這樣我們在比較的時候,只需要判斷兩個字符串是否相等就可以了。
1 /// <summary> 2 /// 對數組進行深拷貝 3 /// </summary> 4 /// <param name="files"></param> 5 /// <returns></returns> 6 public static List<Dictionary<string, string>> CopyList(List<Dictionary<string, string>> files) 7 { 8 MemoryStream ms = new MemoryStream();//序列化 9 BinaryFormatter bf = new BinaryFormatter(); 10 bf.Serialize(ms, files); 11 ms.Position = 0; 12 13 List<Dictionary<string, string>> array3 = (List<Dictionary<string, string>>)bf.Deserialize(ms); //反序列化 14 return array3; 15 } 16 17 /// <summary> 18 /// 比較圖片 19 /// </summary> 20 /// <param name="listDic"></param> 21 /// <param name="filePath"></param> 22 /// <returns></returns> 23 public static List<Dictionary<object, string>> chekImg2(List<Dictionary<string, string>> listDic,string filePath) 24 { 25 List<Dictionary<object, string>> list = new List<Dictionary<object, string>>(); 26 27 DirectoryInfo dir = new DirectoryInfo(filePath); 28 var files = dir.GetFiles().ToList(); 29 30 for (int j = 0; j < listDic.Count; j++) 31 { 32 var file = listDic[j]; 33 34 35 var fileList = CopyList(listDic); 36 var index = 0; 37 var isFirst = false; 38 Dictionary<object, string> dic = new Dictionary<object, string>(); 39 for (int i = 0; i < fileList.Count; i++) 40 { 41 var fileInfo = fileList[i]; 42 43 if (file["imgName"] == fileInfo["imgName"]) 44 { 45 fileList.Remove(fileInfo); 46 i -= 1; 47 continue; 48 } 49 //使用equals比普通的,string==string 高效很多倍 50 if (file["base64"].Equals(fileInfo["base64"])) 51 { 52 if (!isFirst) 53 { 54 dic[++index] = file["imgName"]; 55 isFirst = true; 56 } 57 dic[++index] = fileInfo["imgName"]; 58 59 fileList.Remove(fileInfo); 60 61 listDic.Remove(listDic.Where(c => c.Values.Contains(fileInfo["imgName"])).FirstOrDefault()); 62 i -= 1; 63 } 64 else 65 { 66 fileList.Remove(fileInfo); 67 i -= 1; 68 } 69 70 } 71 72 if (dic.Keys.Count > 0) 73 { 74 list.Add(dic); 75 listDic.Remove(file); 76 j -= 1; 77 } 78 else 79 { 80 listDic.Remove(file); 81 j -= 1; 82 } 83 } 84 return list; 85 }
這樣,我們就可以將完全相同的圖片都取出來存放在一個dictionary中,每一組相同的都是一個dictionary,然后存放到list數組中。需要的時候遍歷出來就可以了。
總結
大量比對的時候,最好先將圖片轉換為string吧。如果在兩個for里面實現這個轉換,時間會是現在的很多倍,因為造成了許多重復的轉換。然后在比對的過程中,盡量將已經比對過的圖片從數組中剔除,這樣比對,你會發現越來越快。