1.Hashtable
哈希表(HashTable)表示鍵/值對的集合。在.NET Framework中,Hashtable是System.Collections命名空間提供的一個容器,用於處理和表現類似key-value的鍵值對,其中key通常可用來快速查找,同時key是區分大小寫;value用於存儲對應於key的值。Hashtable中key-value鍵值對均為object類型,所以Hashtable可以支持任何類型的keyvalue鍵值對,任何非 null 對象都可以用作鍵或值。
2.HashSet類
主要是設計用來做高性能集運算的,例如對兩個集合求交集、並集、差集等。集合中包含一組不重復出現且無特性順序的元素,HashSet拒絕接受重復的對象。
HashSet的一些特性如下:
a. HashSet中的值不能重復且沒有順序。
b. HashSet的容量會按需自動添加。
3.Dictionary
他本身有集合的功能有時候可以把它看成數組
他的結構是這樣的:Dictionary<[key], [value]>
他的特點是存入對象是需要與[key]值一一對應的存入該泛型
通過某一個一定的[key]去找到對應的值
Hashtable 與 Dictionary
第一、存儲的數據類型
Hashtable不是泛型的,不是類型安全的;Dictionary是泛型的,是類型安全的;
Hashtable的鍵值都是Object類型的,但是Dictionary的鍵值的數據類型是可以指定的。
也就是說如果往Hashtable里面存入Object以外的數據類型,則在取出該數據時,需要對其進行顯示的類型轉換,才能夠正常使用。而Dictionary則沒有這個問題。
從這方面講的話,Hashtable相當於Dictionary<Object,Object>
Hashtable ht = new Hashtable();
Dictionary<string, int> dic = new Dictionary<string, int>();
ht.Add("A", 1);
dic.Add("A", 1);
//Console.WriteLine(ht["A"]+1); //編譯錯誤!Object類型不能和int類型直接進行相加。
Console.WriteLine((int)ht["A"] + 1);//編譯通過,輸出結果為:2
Console.WriteLine(dic["A"] + 1);
第二、讀取數據的順序與添加數據的順序的一致性
Dictionary和Hashtable的讀取數據的順序和添加數據時的數據的順序的一致性均不能夠保證,或者可以說沒有一致性。
Dictionary在只添加不刪除的時候能夠保持讀取數據的順序和添加時候的順序是一致的;但是經過刪除和添加操作之后,就不能夠保證讀取數據的順序和添加時候的順序一致了。
Dictionary<int, int> dic = new Dictionary<int, int>();
dic.Add(0, 0);
dic.Add(1, 1);
dic.Add(2, 2);
Console.WriteLine("僅僅經過添加元素處理之后:");
foreach (KeyValuePair<int, int> kvp in dic)
{
Console.WriteLine("Key:" + kvp.Key + " Value:" + kvp.Value);
}
dic.Remove(0);
dic.Add(3, 3);
Console.WriteLine("經過刪除和添加元素處理之后:");
foreach (KeyValuePair<int, int> kvp in dic)
{
Console.WriteLine("Key:" + kvp.Key + " Value:" + kvp.Value);
}
對於Dicitionary而言,如果從中刪除一個元素,則之后新添加的元素會填補這個被刪除元素的位置,因而致使添加數據的順序與讀取數據的順序是不一致的。
對於Hashtable而言,它的數據存儲順序是按一定的算法算出來的,所以絕大多數情況下,它的數據讀取順序和數據添加順序是不一致的。
所以如果你需要保持數據添加時的順序的時候,最好不要用Dictionary和Hashtable。
第三、當用一個不存在的Key值到Hashtable或者Dictionary中取值時
對於Hashtable而言,如果用一個不存在的Key值進行取值的話,會返回一個null;
Hashtable ht = new Hashtable();
Console.WriteLine(ht["b"]==null);
對於Dictionary而言,如果用一個不存在的Key值進行取值的話,會引發“System.Collections.Generic.KeyNotFoundException”類型的異常。
所以在從Dictionary或者Hashtable取值時,可以先判斷Key值是否存在(用ContainsKey()方法進行判斷),以防止出現預期以外的值或者異常。
第四、線程安全性
Dictionary不是線程安全的,Hashtable是線程安全的。對 Hashtable 進一步調用 Synchronized() 方法可以獲得完全線程安全的類型. 而 Dictionary 非線程安全, 必須人為使用 lock 語句進行保護, 效率大減。
HashSet代替List問題
NET3.5多了個HasSet<T>用來存儲集合。從名稱可以看出,它是基於Hash的。可以簡單理解為沒有Value的Dictionary<TKey,TValue>。
HashSet<T>不能用索引訪問,不能存儲重復數據,元素T必須正確實現了Equals和GetHashCode。
那它的優勢是什么呢?
檢索的性能。簡單的說它的Contains方法的性能在大數據量時比List<T>好得多。HashSet<T>的Contains方法復雜度是O(1),List<T>的Contains方法復雜度是O(n)。
那么,在集合的目的是為了檢索的情況下,我們應該使用HashSet<T>代替List<T>。比如一個存儲關鍵字的集合,運行的時候通過其Contains方法檢查輸入字符串是否關鍵字。
HashSet<T>是專門設計用來做集合運算(取交集,並集等),所以提供了UnionWith、IntersectWith等方法。
另:如果數據量很小,那么任然推薦使用List<T>。
這個“小”是多小呢?其實是用Hashtable還是ListDictionary時存在同樣的取舍問題,.NET為其設計了HybridDictionary類實現一個混合容器,當數量小於等於8(目前是8,不保證微軟以后不會變)的時候,HybridDictionary內部使用ListDictionary,當數量大於8的時候,HybridDictionary內部使用Hashtable。所以,如果我們知道我們集合的數量不會大於8的話,就算目的是為了檢索,任然推薦使用List<T>。
由於 Hashtable 和 Dictionary 同時存在, 在使用場景上必然存在選擇性, 並不任何時刻都能相互替代.
[1] 單線程程序中推薦使用 Dictionary, 有泛型優勢, 且讀取速度較快, 容量利用更充分.
[2] 多線程程序中推薦使用 Hashtable, 默認的 Hashtable 允許單線程寫入, 多線程讀取, 對 Hashtable 進一步調用 Synchronized() 方法可以獲得完全線程安全的類型. 而 Dictionary 非線程安全, 必須人為使用 lock 語句進行保護, 效率大減.
[3] Dictionary 有按插入順序排列數據的特性 (注: 但當調用 Remove() 刪除過節點后順序被打亂), 因此在需要體現順序的情境中使用 Dictionary 能獲得一定方便.