btree索引與hash索引的區別,之前不清楚,mark一下。
Hash索引結構的特殊性,其檢索效率非常高,索引的檢索可以一次定位,不像B-Tree索引需要從根節點到枝節點,最后才能訪問到頁節點這樣多次的IO訪問,所以Hash索引的查詢效率要遠高於B-Tree索引。
可能很多人又有疑問了,既然Hash索引的效率要比B-Tree高很多,為什么大家都不用Hash索引而還要使用B-Tree索引呢?任何事物都是有兩面性的,Hash索引也一樣,雖然Hash索引效率高,但是Hash索引本身由於其特殊性也帶來了很多限制和弊端,主要有以下這些:
1、Hash索引僅僅能夠滿足“=”,“IN”和“<=>”查詢,不能使用范圍查詢。
由於Hash索引比較的是進行Hash運算之后的Hash值,所以它只能用於等值的過濾,不能用於基於范圍的過濾,因為進過相應的Hash算法處理之后的Hash值的大小關系,並不能保證和Hash運算前完全一樣。
2、Hash索引無法被用來避免數據的排序操作
由於Hash索引中存放的是經過Hash計算之后的Hash值,而且Hash值的大小管理並不一定和Hash運算前的鍵值完全一樣,所以數據庫無法利用索引的數據來避免任何排序運算。
3、Hash索引不能利用部分索引查詢
對於組合索引,Hash索引在計算Hash值的時候是組合索引鍵合並后再一起計算Hashs值,而不是單獨計算Hash值,所以通過組合索引的前面一個或者幾個索引鍵進行查詢的時候,Hash索引也無法被利用。
4、Hash索引在任何時候都不能避免表掃描
前面已經知道,Hash索引是將索引鍵通過Hash運算之后,將Hash運算結果的Hash值和對應的行指針信息存放於一個Hash表中,由於不同索引鍵存在相同Hash值,所以即使取滿足某個Hash鍵值的數據的記錄條數,也無法從Hash索引中年直接完成查詢,還要通過訪問表中實際數據進行相應的比較,並得到相應的結果。
5、Hash索引遇到大量Hash值相等的情況后性能不一定會比B-Tree索引高
對於選擇性比較低的索引鍵,如果創建Hash索引,那么將會存在大量記錄指針信息存於同一個Hash值相關聯。這樣要定位某一條記錄時就會非常麻煩,會浪費多次表數據的訪問,而造成整體性能低下。