HashSet 與TreeSet和LinkedHashSet的區別

本文轉載自查看原文 2016-11-01 15:32 22945 Java

Set接口
Set不允許包含相同的元素，如果試圖把兩個相同元素加入同一個集合中，add方法返回false。
Set判斷兩個對象相同不是使用==運算符，而是根據equals方法。也就是說，只要兩個對象用equals方法比較返回true，Set就不會接受這兩個對象。

HashSet與TreeSet都是基於Set接口的實現類。其中TreeSet是Set的子接口SortedSet的實現類。Set接口及其子接口、實現類的結構如下所示：

|——SortedSet接口——TreeSet實現類

Set接口——|——HashSet實現類

|——LinkedHashSet實現類

HashSet
HashSet有以下特點
 不能保證元素的排列順序，順序有可能發生變化
 不是同步的
 集合元素可以是null,但只能放入一個null
當向HashSet結合中存入一個元素時，HashSet會調用該對象的hashCode()方法來得到該對象的hashCode值，然后根據 hashCode值來決定該對象在HashSet中存儲位置。

簡單的說，HashSet集合判斷兩個元素相等的標准是兩個對象通過equals方法比較相等，並且兩個對象的hashCode()方法返回值相等
注意，如果要把一個對象放入HashSet中，重寫該對象對應類的equals方法，也應該重寫其hashCode()方法。其規則是如果兩個對象通過equals方法比較返回true時，其 hashCode也應該相同。另外，對象中用作equals比較標准的屬性，都應該用來計算 hashCode的值。

TreeSet

TreeSet類型是J2SE中唯一可實現自動排序的類型

    TreeSet是SortedSet接口的唯一實現類，TreeSet可以確保集合元素處於排序狀態。TreeSet支持兩種排序方式，自然排序和定制排序，其中自然排序為默認的排序方式。向 TreeSet中加入的應該是同一個類的對象。
    TreeSet判斷兩個對象不相等的方式是兩個對象通過equals方法返回false，或者通過CompareTo方法比較沒有返回0
自然排序
    自然排序使用要排序元素的CompareTo（Object obj）方法來比較元素之間大小關系，然后將元素按照升序排列。
    Java提供了一個Comparable接口，該接口里定義了一個compareTo(Object obj)方法，該方法返回一個整數值，實現了該接口的對象就可以比較大小。
    obj1.compareTo(obj2)方法如果返回0，則說明被比較的兩個對象相等，如果返回一個正數，則表明obj1大於obj2，如果是負數，則表明obj1小於obj2。
    如果我們將兩個對象的equals方法總是返回true，則這兩個對象的compareTo方法返回應該返回0
定制排序
    自然排序是根據集合元素的大小，以升序排列，如果要定制排序，應該使用Comparator接口，實現 int compare(To1,To2)方法

LinkedHashSet
LinkedHashSet集合同樣是根據元素的hashCode值來決定元素的存儲位置，但是它同時使用鏈表維護元素的次序。這樣使得元素看起來像是以插入順序保存的，也就是說，當遍歷該集合時候，LinkedHashSet將會以元素的添加順序訪問集合的元素。
LinkedHashSet在迭代訪問Set中的全部元素時，性能比HashSet好，但是插入時性能稍微遜色於HashSet。

有許多人學了很長時間的Java，但一直不明白hashCode方法的作用，
我來解釋一下吧。首先，想要明白hashCode的作用，你必須要先知道Java中的集合。

java的HashCode方法

總的來說，Java中的集合（Collection）有兩類，一類是List，再有一類是Set。

你知道它們的區別嗎？前者集合內的元素是有序的，元素可以重復；后者元素無序，但元素不可重復。

那么這里就有一個比較嚴重的問題了：要想保證元素不重復，可兩個元素是否重復應該依據什么來判斷呢？

這就是Object.equals方法了。但是，如果每增加一個元素就檢查一次，那么當元素很多時，后添加到集合中的元素比較的次數就非常多了。也就是說，如果集合中現在已經有1000個元素，那么第1001個元素加入集合時，它就要調用1000次equals方法。這顯然會大大降低效率。

於是，Java采用了哈希表的原理。哈希（Hash）實際上是個人名，由於他提出一哈希算法的概念，所以就以他的名字命名了。哈希算法也稱為散列算法，是將數據依特定算法直接指定到一個地址上。如果詳細講解哈希算法，那需要更多的文章篇幅，我在這里就不介紹了。

初學者可以這樣理解，hashCode方法實際上返回的就是對象存儲的物理地址（實際可能並不是）。這樣一來，當集合要添加新的元素時，先調用這個元素的hashCode方法，就一下子能定位到它應該放置的物理位置上。如果這個位置上沒有元素，它就可以直接存儲在這個位置上，不用再進行任何比較了；如果這個位置上已經有元素了，就調用它的equals方法與新元素進行比較，相同的話就不存了，不相同就散列其它的地址。所以這里存在一個沖突解決的問題。這樣一來實際調用equals方法的次數就大大降低了，幾乎只需要一兩次。所以，Java對於eqauls方法和hashCode方法是這樣規定的：

1、如果兩個對象相同，那么它們的hashCode值一定要相同；

2、如果兩個對象的hashCode相同，它們並不一定相同

上面說的對象相同指的是用eqauls方法比較。你當然可以不按要求去做了，但你會發現，相同的對象可以出現在Set集合中。同時，增加新元素的效率會大大下降。

hashcode這個方法是用來鑒定2個對象是否相等的。那你會說，不是還有equals這個方法嗎？不錯，這2個方法都是用來判斷2個對象是否相等的。但是他們是有區別的。一般來講，equals這個方法是給用戶調用的，如果你想判斷2個對象是否相等，你可以重寫equals方法，然后在代碼中調用，就可以判斷他們是否相等了。簡單來講，equals方法主要是用來判斷從表面上看或者從內容上看，2個對象是不是相等。

舉個例子，有個學生類，屬性只有姓名和性別，那么我們可以認為只要姓名和性別相等，那么就說這2個對象是相等的。

hashcode方法一般用戶不會去調用，比如在hashmap中，由於key是不可以重復的，他在判斷key是不是重復的時候就判斷了hashcode 這個方法，而且也用到了equals方法。這里不可以重復是說equals和hashcode只要有一個不等就可以了！所以簡單來講，hashcode相當於是一個對象的編碼，就好像文件中的md5，他和equals不同就在於他返回的是int型的，比較起來不直觀。我們一般在覆蓋equals的同時也要覆蓋hashcode，讓他們的邏輯一致。

舉個例子，還是剛剛的例子，如果姓名和性別相等就算2個對象相等的話，那么hashcode的方法也要返回姓名的hashcode值加上性別的hashcode值，這樣從邏輯上，他們就一致了。要從物理上判斷2個對象是否相等，用==就可以了。

免責聲明！

本站轉載的文章為個人學習借鑒使用，本站對版權不負任何法律責任。如果侵犯了您的隱私權益，請聯系本站郵箱yoyou2525@163.com刪除。

猜您在找 HashSet，TreeSet和LinkedHashSet的區別【java提高】---HashSet 與TreeSet和LinkedHashSet的區別 Java集合系列(三)：HashSet、LinkedHashSet、TreeSet的使用方法及區別 HashSet vs TreeSet vs LinkedHashSet Java Set 常用集合 HashSet、LinkedHashSet、TreeSet Java中的集合HashSet、LinkedHashSet、TreeSet和EnumSet(二) Java——HashSet和TreeSet的區別 HashSet與TreeSet 區別 HashSet和TreeSet的區別 HashSet和TreeSet的區別