面試中經常被問到的list如何去重,用來考察你對list數據結構,以及相關方法的掌握,體現你的java基礎學的是否牢固。
我們大家都知道,set集合的特點就是沒有重復的元素。如果集合中的數據類型是基本數據類型,可以直接將list集合轉換成set,就會自動去除重復的元素,這個就相對比較簡單。如下示例:
1 public class Test { 2 public static void main(String[] args) { 3 List list = new ArrayList(); 4 list.add(11); 5 list.add(12); 6 list.add(13); 7 list.add(14); 8 list.add(15); 9 list.add(11); 10 System.out.println(list); 11 Set set = new HashSet(); 12 List newList = new ArrayList(); 13 set.addAll(list); 14 newList.addAll(set); 15 System.out.println(newList); 16 } 17 }
輸出結果為:
我們可以看到去重成功了。
在面試中被問到list去重問題,大部分回答都會是list和set互轉,利用set自動去除重復屬性的方法去重,但是這樣的回答並不會得分。當list集合中存儲的類型是對象類型的時候,我們就不能簡單的只把list集合轉換成set集合。我們定義一個對象類:
1 public class People { 2 3 private String name; 4 private String phoneNumber; 5 6 public String getName() { 7 return name; 8 } 9 10 public void setName(String name) { 11 this.name = name; 12 } 13 14 public String getPhoneNumber() { 15 return phoneNumber; 16 } 17 18 public void setPhoneNumber(String phoneNumber) { 19 this.phoneNumber = phoneNumber; 20 } 21 22 public People(String name, String phoneNumber) { 23 super(); 24 this.name = name; 25 this.phoneNumber = phoneNumber; 26 } 27 28 @Override 29 public String toString() { 30 return "People{" + 31 "name='" + name + '\'' + 32 ", phoneNumber='" + phoneNumber + '\'' + 33 '}'; 34 } 35 36 }
我們使用上面的set去重的方法去重:
1 public static void main(String[] args) { 2 List<People> listPeople = new ArrayList<People>(); 3 listPeople.add(new People("張三", "11111")); 4 listPeople.add(new People("張三", "22222")); 5 listPeople.add(new People("李四", "33333")); 6 listPeople.add(new People("張三", "22222")); 7 8 Set<People> setData = new HashSet<People>(); 9 setData.addAll(listPeople); 10 System.out.println("list:" + listPeople.toString()); 11 System.out.println("set:" + setData.toString()); 12 13 }
運行后輸出的結果為:
我們可以看到第二個張三和最后一個張三,信息都一樣,卻沒有被去重。
當list集合中存儲的是對象時,我們需要在對象的實體類中去重寫equals()方法和hashCode()方法,如下:
1 public class People { 2 3 private String name; 4 private String phoneNumber; 5 6 public String getName() { 7 return name; 8 } 9 10 public void setName(String name) { 11 this.name = name; 12 } 13 14 public String getPhoneNumber() { 15 return phoneNumber; 16 } 17 18 public void setPhoneNumber(String phoneNumber) { 19 this.phoneNumber = phoneNumber; 20 } 21 22 public People(String name, String phoneNumber) { 23 super(); 24 this.name = name; 25 this.phoneNumber = phoneNumber; 26 } 27 28 @Override 29 public String toString() { 30 return "People{" + 31 "name='" + name + '\'' + 32 ", phoneNumber='" + phoneNumber + '\'' + 33 '}'; 34 } 35 36 @Override 37 public boolean equals(Object arg0) { 38 // TODO Auto-generated method stub 39 People p = (People) arg0; 40 return name.equals(p.name) && phoneNumber.equals(p.phoneNumber); 41 } 42 43 @Override 44 public int hashCode() { 45 // TODO Auto-generated method stub 46 String str = name + phoneNumber; 47 return str.hashCode(); 48 } 49 50 }
時運行上面的test方法,去重就成功了。最后,我們拿出String中的equals()方法和hashCode()方法源碼來加深認識:
equals()
1 public boolean equals(Object anObject) { 2 if (this == anObject) { 3 return true; 4 } 5 if (anObject instanceof String) { 6 String anotherString = (String)anObject; 7 int n = count; 8 if (n == anotherString.count) { 9 char v1[] = value; 10 char v2[] = anotherString.value; 11 int i = offset; 12 int j = anotherString.offset; 13 while (n-- != 0) { 14 if (v1[i++] != v2[j++]) 15 return false; 16 } 17 return true; 18 } 19 } 20 return false; 21 }
比較兩個對象時,首先先去判斷兩個對象是否具有相同的地址,如果是同一個對象的引用,則直接放回true;如果地址不一樣,則證明不是引用同一個對象,接下來就是挨個去比較兩個字符串對象的內容是否一致,完全相等返回true,否則false。
hashCode()
1 public int hashCode() { 2 int h = hash; 3 if (h == 0 && count > 0) { 4 int off = offset; 5 char val[] = value; 6 int len = count; 7 for (int i = 0; i < len; i++) { 8 h = 31*h + val[off++]; 9 } 10 hash = h; 11 } 12 return h; 13 }
hashCode()官方定義:
hashcode方法返回該對象的哈希碼值。支持該方法是為哈希表提供一些優點,例如,java.util.Hashtable 提供的哈希表。
hashCode 的常規協定是:
在 Java 應用程序執行期間,在同一對象上多次調用 hashCode 方法時,必須一致地返回相同的整數,前提是對象上 equals 比較中所用的信息沒有被修改。從某一應用程序的一次執行到同一應用程序的另一次執行,該整數無需保持一致。如果根據 equals(Object) 方法,兩個對象是相等的,那么在兩個對象中的每個對象上調用 hashCode 方法都必須生成相同的整數結果。以下情況不是必需的:如果根據 equals(java.lang.Object) 方法,兩個對象不相等,那么在兩個對象中的任一對象上調用 hashCode 方法必定會生成不同的整數結果。但是,程序員應該知道,為不相等的對象生成不同整數結果可以提高哈希表的性能。實際上,由 Object 類定義的 hashCode 方法確實會針對不同的對象返回不同的整數。(這一般是通過將該對象的內部地址轉換成一個整數來實現的,但是 JavaTM 編程語言不需要這種實現技巧。)當equals方法被重寫時,通常有必要重寫 hashCode 方法,以維護 hashCode 方法的常規協定,該協定聲明相等對象必須具有相等的哈希碼。
當然,List去重的方法很多,可以用for循環或者使用java8新特性stream等等,下面分別介紹一下五種方法:
1 //新建一個list數組: 2 List list = new ArrayList(); 3 list.add(26); 4 list.add(39); 5 list.add(5); 6 list.add(40); 7 list.add(39); 8 list.add(25); 9 System.out.println(list); 10 //方法一:使用java8新特性stream進行List去重 11 List newList = list.stream().distinct().collect(Collectors.toList()); 12 System.out.println(“java8新特性stream去重:”+newList); 13 list.add(39); 14 //方法二:雙重for循環去重 15 for (int i = 0; i < list.size(); i++) { 16 for (int j = 0; j < list.size(); j++) { 17 if(i!=j&&list.get(i)==list.get(j)) { 18 list.remove(list.get(j)); 19 } 20 } 21 } 22 System.out.println(“雙重for循環去重:”+list); 23 list.add(39); 24 //方法三:set集合判斷去重,不打亂順序 25 Set set1 = new HashSet(); 26 List newList1 = new ArrayList(); 27 for (Integer integer : list) { 28 if(set1.add(integer)) { 29 newList1.add(integer); 30 } 31 } 32 System.out.println(“set集合判斷去重:”+list); 33 list.add(39); 34 //方法四:遍歷后判斷賦給另一個list集合 35 List newList2 = new ArrayList(); 36 for (Integer integer : list) { 37 if(!newList2.contains(integer)){ 38 newList2.add(integer); 39 } 40 } 41 System.out.println(“賦值新list去重:”+newList2); 42 list.add(39); 43 //方法五:set和list轉換去重 44 Set set2 = new HashSet(); 45 List newList3 = new ArrayList(); 46 set2.addAll(list); 47 newList3.addAll(set2); 48 System.out.println(“set和list轉換去重:”+newList3);