c#高效比對大量圖片


比較圖片的方法

  以前傳統的比較方式是遍歷圖片中的每一個像素,然后進行比對。這樣的比對在少量圖片的比對上雖然效率低一點,但是也沒有什么不好。但是在大量圖片比對的時候,過長的反應時間和對服務器比較高的消耗肯定是不行的。

  所以微軟給我們提供了另外一種比對的方法,能夠正確,高效的比對出兩張圖片的是否相同。這種方法的原理是:將圖片保存到數據流中然后使用Convert.ToBase64String將數據流轉換為字符串,那么我們只需要比對兩張圖片的字符串就ok了。代碼如下:

 1   public bool CheckImg(string filePath1, string filePath2)
 2         {
 3         
 4            
 5             MemoryStream ms1 = new MemoryStream();
 6             Image image1 = Image.FromFile(filePath1);
 7             image1.Save(ms1, System.Drawing.Imaging.ImageFormat.Jpeg);
 8 
 9             string img1 = Convert.ToBase64String(ms1.ToArray());
10 
11             Image image2 = Image.FromFile(filePath2);
12             image2.Save(ms1, System.Drawing.Imaging.ImageFormat.Jpeg);
13             string img2 = Convert.ToBase64String(ms1.ToArray());
14 
15             if (img1.Equals(img2))
16             {
17                return true;
18             }
19             else
20             {
21                 return false;
22             }
23         }
比較圖片

     這種方法我使用控制台測試了下時間,時間大概為0.015s左右比較一張圖片的時間。還是比較高效的。

 

大量圖片的比較

     比較兩張圖片能夠滿足需求,那么大量呢? 我這邊也做了這種測試的。在450張圖片中,選擇出其中重復的圖片,並展示出來。大概時間是16s左右,基本能夠滿足大部分的需求了。

  比較方法是,先講450張圖片,全部一次性轉換為string類型,存放到一個數組里面,這樣就避免了每次循環都要額外的去轉換,使程序的效率降低很多。

   

 1   public static List<Dictionary<string, string>> chekImgss(string filePath)
 2         {
 3             
 4             List<Dictionary<string, string>> liststr = new List<Dictionary<string, string>>();
 5             DirectoryInfo dir = new DirectoryInfo(filePath);
 6             FileInfo[] files = dir.GetFiles();
 7             foreach (FileInfo fileInfo in files)
 8             {
 9                 Dictionary<string, string> dic = new Dictionary<string, string>();
10                 string ex = fileInfo.Extension;
11                 if (ex == ".jpg" || ex == ".png")
12                 {
13                     MemoryStream ms1 = new MemoryStream();
14                     Image image2 = Image.FromFile(filePath + fileInfo.Name);
15                     image2.Save(ms1, System.Drawing.Imaging.ImageFormat.Jpeg);
16                    
17                     string imgBase64 = Convert.ToBase64String(ms1.ToArray());
18 
19                     dic["base64"] = imgBase64;
20                     dic["imgName"] = fileInfo.Name;
21                     liststr.Add(dic);
22                 }
23             }
24 
25             return liststr;
26         }

        將圖片的base64string和圖片的名稱存儲在一個dictionary中,然后存儲到list數組中。這樣我們在比較的時候,只需要判斷兩個字符串是否相等就可以了。

   

 1         /// <summary>
 2         /// 對數組進行深拷貝
 3         /// </summary>
 4         /// <param name="files"></param>
 5         /// <returns></returns>
 6         public static List<Dictionary<string, string>> CopyList(List<Dictionary<string, string>> files)
 7         {
 8             MemoryStream ms = new MemoryStream();//序列化
 9             BinaryFormatter bf = new BinaryFormatter();
10             bf.Serialize(ms, files);
11             ms.Position = 0;
12 
13             List<Dictionary<string, string>> array3 = (List<Dictionary<string, string>>)bf.Deserialize(ms);  //反序列化
14             return array3;
15         }
16 
17         /// <summary>
18         /// 比較圖片
19         /// </summary>
20         /// <param name="listDic"></param>
21         /// <param name="filePath"></param>
22         /// <returns></returns>
23         public static List<Dictionary<object, string>> chekImg2(List<Dictionary<string, string>> listDic,string filePath)
24         {
25             List<Dictionary<object, string>> list = new List<Dictionary<object, string>>();
26 
27             DirectoryInfo dir = new DirectoryInfo(filePath);
28             var files = dir.GetFiles().ToList();
29 
30             for (int j = 0; j < listDic.Count; j++)
31             {
32                 var file = listDic[j];
33 
34                 
35                 var fileList = CopyList(listDic);
36                 var index = 0;
37                 var isFirst = false;
38                 Dictionary<object, string> dic = new Dictionary<object, string>();
39                 for (int i = 0; i < fileList.Count; i++)
40                 {
41                     var fileInfo = fileList[i];
42 
43                     if (file["imgName"] == fileInfo["imgName"])
44                     {
45                         fileList.Remove(fileInfo);
46                         i -= 1;
47                         continue;
48                     }
49                     //使用equals比普通的,string==string 高效很多倍
50                     if (file["base64"].Equals(fileInfo["base64"]))
51                     {
52                         if (!isFirst)
53                         {
54                             dic[++index] = file["imgName"];
55                             isFirst = true;
56                         }
57                         dic[++index] = fileInfo["imgName"];
58 
59                         fileList.Remove(fileInfo);
60 
61                         listDic.Remove(listDic.Where(c => c.Values.Contains(fileInfo["imgName"])).FirstOrDefault());
62                         i -= 1;
63                     }
64                     else
65                     {
66                         fileList.Remove(fileInfo);
67                         i -= 1;
68                     }
69 
70                 }
71 
72                 if (dic.Keys.Count > 0)
73                 {
74                     list.Add(dic);
75                     listDic.Remove(file);
76                     j -= 1;
77                 }
78                 else
79                 {
80                     listDic.Remove(file);
81                     j -= 1;
82                 }
83             }
84             return list;
85         }

        這樣,我們就可以將完全相同的圖片都取出來存放在一個dictionary中,每一組相同的都是一個dictionary,然后存放到list數組中。需要的時候遍歷出來就可以了。

 

總結

      大量比對的時候,最好先將圖片轉換為string吧。如果在兩個for里面實現這個轉換,時間會是現在的很多倍,因為造成了許多重復的轉換。然后在比對的過程中,盡量將已經比對過的圖片從數組中剔除,這樣比對,你會發現越來越快。


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM