哈希表和哈希函數
在記錄的存儲位置和它的關鍵字之間是建立一個確定的對應關系(映射函數),使每個關鍵字和一個存儲位置能唯一對應。這個映射函數稱為哈希函數,根據這個原則建立的表稱為哈希表(Hash Table),也叫散列表。
以上描述,如果通過數學形式來描述就是:
若查找關鍵字為 key,則其值存放在 f(key) 的存儲位置上。由此,不需比較便可直接取得所查記錄。
注:哈希查找與線性表查找和樹表查找最大的區別在於,不用數值比較。
沖突
若 key1 ≠ key2 ,而 f(key1) = f(key2),這種情況稱為沖突(Collision)。
根據哈希函數f(key)和處理沖突的方法將一組關鍵字映射到一個有限的連續的地址集(區間)上,並以關鍵字在地址集中的“像”作為記錄在表中的存儲位置,這一映射過程稱為構造哈希表。
構造哈希表這個場景就像汽車找停車位,如果車位被人占了,只能找空的地方停。

由以上內容可知,哈希查找本身其實不費吹灰之力,問題的關鍵在於如何構造哈希表和處理沖突。
常見的構造哈希表的方法有 5 種:
(1)直接定址法
說白了,就是小學時學過的一元一次方程。
即 f(key) = a * key + b。其中,a和b 是常數。
(2)數字分析法
假設關鍵字是R進制數(如十進制)。並且哈希表中可能出現的關鍵字都是事先知道的,則可選取關鍵字的若干數位組成哈希地址。
選取的原則是使得到的哈希地址盡量避免沖突,即所選數位上的數字盡可能是隨機的。
(3)平方取中法
取關鍵字平方后的中間幾位為哈希地址。通常在選定哈希函數時不一定能知道關鍵字的全部情況,僅取其中的幾位為地址不一定合適;
而一個數平方后的中間幾位數和數的每一位都相關, 由此得到的哈希地址隨機性更大。取的位數由表長決定。
(4)除留余數法
取關鍵字被某個不大於哈希表表長 m 的數 p 除后所得的余數為哈希地址。
即 f(key) = key % p (p ≤ m)
這是一種最簡單、最常用的方法,它不僅可以對關鍵字直接取模,也可在折疊、平方取中等運算之后取模。
注意:p的選擇很重要,如果選的不好,容易產生沖突。根據經驗,一般情況下可以選p為素數。
(5)隨機數法
選擇一個隨機函數,取關鍵字的隨機函數值為它的哈希地址,即 f(key) = random(key)。
通常,在關鍵字長度不等時采用此法構造哈希函數較為恰當。
設計合理的哈希函數可以減少沖突,但不能完全避免沖突。
所以需要有解決沖突的方法,常見有兩類
(1)開放定址法
當程序查找哈希表時,如果沒有在第一個對應的哈希表項中找到符合查找要求的數據元素,程序就會繼續往后查找,直到找到一個符合查找要求的數據元素,或者遇到一個空的表項。
例子
若要將一組關鍵字序列 {1, 9, 25, 11, 12, 35, 17, 29} 存放到哈希表中。
采用除留余數法構造哈希表;采用開放定址法處理沖突。
不妨設選取的p和m為13,由 f(key) = key % 13 可以得到下表。
需要注意的是,在上圖中有兩個關鍵字的探查次數為 2 ,其他都是1。
這個過程是這樣的:
a. 12 % 13 結果是12,而它的前面有個 25 ,25 % 13 也是12,存在沖突。
我們使用開放定址法 (12 + 1) % 13 = 0,沒有沖突,完成。
b. 35 % 13 結果是 9,而它的前面有個 9,9 % 13也是 9,存在沖突。
(2)拉鏈法
在這種方法中,哈希表中每個單元存放的不再是記錄本身,而是相應同義詞單鏈表的頭指針。
例子
如果對開放定址法例子中提到的序列使用拉鏈法,得到的結果如下圖所示:
假設要實現一個哈希表,要求
a. 哈希函數采用除留余數法,即 f(key) = key % p (p ≤ m)
b. 解決沖突采用開放定址法,即 f2(key) = (f(key)+i) % size (p ≤ m)
(1)定義哈希表的數據結構
public int key = 0; // 關鍵字
public int data = 0; // 數值
public int count = 0; // 探查次數
}
(2)在哈希表中查找關鍵字key
根據設定的哈希函數,計算哈希地址。如果出現地址沖突,則按設定的處理沖突的方法尋找下一個地址。
如此反復,直到不沖突為止(查找成功)或某個地址為空(查找失敗)。
* 查找哈希表
* 構造哈希表采用除留取余法,即f(key) = key mod p (p ≤ size)
* 解決沖突采用開放定址法,即f2(key) = (f(key) + i) mod p (1 ≤ i ≤ size-1)
* ha為哈希表,p為模,size為哈希表大小,key為要查找的關鍵字
*/
public int searchHashTable(HashTable[] ha, int p, int size, int key) {
int addr = key % p; // 采用除留取余法找哈希地址
// 若發生沖突,用開放定址法找下一個哈希地址
while (ha[addr].key != NULLKEY && ha[addr].key != key) {
addr = (addr + 1) % size;
}
if (ha[addr].key == key) {
return addr; // 查找成功
} else {
return FAILED; // 查找失敗
}
}
(3)刪除關鍵字為key的記錄
在采用開放定址法處理沖突的哈希表上執行刪除操作,只能在被刪記錄上做刪除標記,而不能真正刪除記錄。
int addr = 0;
addr = searchHashTable(ha, p, size, key);
if (FAILED != addr) { // 找到記錄
ha[addr].key = DELKEY; // 將該位置的關鍵字置為DELKEY
return SUCCESS;
} else {
return NULLKEY; // 查找不到記錄,直接返回NULLKEY
}
}
(4)插入關鍵字為key的記錄
先調用查找算法,若在表中找到待插入的關鍵字,則插入失敗;
若在表中找到一個開放地址,則將待插入的結點插入到其中,則插入成功。
int i = 1;
int addr = 0;
addr = key % p; // 通過哈希函數獲取哈希地址
if (ha[addr].key == NULLKEY || ha[addr].key == DELKEY) { // 如果沒有沖突,直接插入
ha[addr].key = key;
ha[addr].count = 1;
} else { // 如果有沖突,使用開放定址法處理沖突
do {
addr = (addr + 1) % size; // 尋找下一個哈希地址
i++;
} while (ha[addr].key != NULLKEY && ha[addr].key != DELKEY);
ha[addr].key = key;
ha[addr].count = i;
}
}
(5)建立哈希表
先將哈希表中各關鍵字清空,使其地址為開放的,然后調用插入算法將給定的關鍵字序列依次插入。
int i = 0;
// 將哈希表中的所有關鍵字清空
for (i = 0; i < ha.length; i++) {
ha[i].key = NULLKEY;
ha[i].count = 0;
}
// 將關鍵字序列依次插入哈希表中
for (i = 0; i < list.length; i++) {
this.insertHashTable(ha, p, size, list[i]);
}
}
完整代碼

2 public int key = 0; // 關鍵字
3 public int data = 0; // 數值
4 public int count = 0; // 探查次數
5 }
6
7 public class HashSearch {
8
9 private final static int MAXSIZE = 20;
10 private final static int NULLKEY = 1;
11 private final static int DELKEY = 2;
12 private final static int SUCCESS = 0;
13 private final static int FAILED = 0xFFFFFFFF;
14
15 /**
16 * 查找哈希表
17 * 構造哈希表采用除留取余法,即f(key) = key mod p (p ≤ size)
18 * 解決沖突采用開放定址法,即f2(key) = (f(key) + i) mod p (1 ≤ i ≤ size-1)
19 * ha為哈希表,p為模,size為哈希表大小,key為要查找的關鍵字
20 */
21 public int searchHashTable(HashTable[] ha, int p, int size, int key) {
22 int addr = key % p; // 采用除留取余法找哈希地址
23
24 // 若發生沖突,用開放定址法找下一個哈希地址
25 while (ha[addr].key != NULLKEY && ha[addr].key != key) {
26 addr = (addr + 1) % size;
27 }
28
29 if (ha[addr].key == key) {
30 return addr; // 查找成功
31 } else {
32 return FAILED; // 查找失敗
33 }
34 }
35
36 /**
37 * 刪除哈希表中關鍵字為key的記錄
38 * 找到要刪除的記錄,將關鍵字置為刪除標記DELKEY
39 */
40 public int deleteHashTable(HashTable[] ha, int p, int size, int key) {
41 int addr = 0;
42 addr = searchHashTable(ha, p, size, key);
43 if (FAILED != addr) { // 找到記錄
44 ha[addr].key = DELKEY; // 將該位置的關鍵字置為DELKEY
45 return SUCCESS;
46 } else {
47 return NULLKEY; // 查找不到記錄,直接返回NULLKEY
48 }
49 }
50
51 /**
52 * 將待插入的關鍵字key插入哈希表
53 * 先調用查找算法,若在表中找到待插入的關鍵字,則插入失敗;
54 * 若在表中找到一個開放地址,則將待插入的結點插入到其中,則插入成功。
55 */
56 public void insertHashTable(HashTable[] ha, int p, int size, int key) {
57 int i = 1;
58 int addr = 0;
59 addr = key % p; // 通過哈希函數獲取哈希地址
60 if (ha[addr].key == NULLKEY || ha[addr].key == DELKEY) { // 如果沒有沖突,直接插入
61 ha[addr].key = key;
62 ha[addr].count = 1;
63 } else { // 如果有沖突,使用開放定址法處理沖突
64 do {
65 addr = (addr + 1) % size; // 尋找下一個哈希地址
66 i++;
67 } while (ha[addr].key != NULLKEY && ha[addr].key != DELKEY);
68
69 ha[addr].key = key;
70 ha[addr].count = i;
71 }
72 }
73
74 /**
75 * 創建哈希表
76 * 先將哈希表中各關鍵字清空,使其地址為開放的,然后調用插入算法將給定的關鍵字序列依次插入。
77 */
78 public void createHashTable(HashTable[] ha, int[] list, int p, int size) {
79 int i = 0;
80
81 // 將哈希表中的所有關鍵字清空
82 for (i = 0; i < ha.length; i++) {
83 ha[i].key = NULLKEY;
84 ha[i].count = 0;
85 }
86
87 // 將關鍵字序列依次插入哈希表中
88 for (i = 0; i < list.length; i++) {
89 this.insertHashTable(ha, p, size, list[i]);
90 }
91 }
92
93 /**
94 * 輸出哈希表
95 */
96 public void displayHashTable(HashTable[] ha) {
97 int i = 0;
98 System.out.format("pos:\t", "pos");
99 for (i = 0; i < ha.length; i++) {
100 System.out.format("%4d", i);
101 }
102 System.out.println();
103
104 System.out.format("key:\t");
105 for (i = 0; i < ha.length; i++) {
106 if (ha[i].key != NULLKEY) {
107 System.out.format("%4d", ha[i].key);
108 } else {
109 System.out.format(" ");
110 }
111 }
112 System.out.println();
113
114 System.out.format("count:\t");
115 for (i = 0; i < ha.length; i++) {
116 if (0 != ha[i].count) {
117 System.out.format("%4d", ha[i].count);
118 } else {
119 System.out.format(" ");
120 }
121 }
122 System.out.println();
123 }
124
125 public static void main(String[] args) {
126 int[] list = { 3, 112, 245, 27, 44, 19, 76, 29, 90 };
127 HashTable[] ha = new HashTable[MAXSIZE];
128 for ( int i = 0; i < ha.length; i++) {
129 ha[i] = new HashTable();
130 }
131
132 HashSearch search = new HashSearch();
133 search.createHashTable(ha, list, 19, MAXSIZE);
134 search.displayHashTable(ha);
135
136 }
137
138 }