為什么mysql索引用B+樹而不用哈希表

本文轉載自查看原文 2021-02-20 09:48 724 MySQL

Hash 索引的限制和弊端

Hash 索引結構的特殊性，其檢索效率非常高，索引的檢索可以一次定位，不像B+Tree 索引需要從根節點到枝節點，最后才能訪問到頁節點這樣多次的IO訪問，所以 Hash 索引的查詢效率要遠高於 B+Tree 索引。

可能很多人又有疑問了，既然 Hash 索引的效率要比 B+Tree 高很多，為什么大家不都用 Hash 索引而還要使用 B+Tree 索引呢？任何事物都是有兩面性的，Hash 索引也一樣，雖然 Hash 索引效率高，但是 Hash 索引本身由於其特殊性也帶來了很多限制和弊端，主要有以下這些。

Hash 索引僅僅能滿足”=”,”IN”和”<=>”查詢，不能使用范圍查詢。由於 Hash 索引比較的是進行 Hash 運算之后的 Hash 值，所以它只能用於等值的過濾，不能用於基於范圍的過濾，因為經過相應的 Hash 算法處理之后的 Hash 值的大小關系，並不能保證和Hash運算前完全一樣。

Hash 索引無法被用來避免數據的排序操作。由於 Hash 索引中存放的是經過 Hash 計算之后的 Hash 值，而且Hash值的大小關系並不一定和 Hash 運算前的鍵值完全一樣，所以數據庫無法利用索引的數據來避免任何排序運算；

Hash 索引不能利用部分索引鍵查詢。對於組合索引，Hash 索引在計算 Hash 值的時候是組合索引鍵合並后再一起計算 Hash 值，而不是單獨計算 Hash 值，所以通過組合索引的前面一個或幾個索引鍵進行查詢的時候，Hash 索引也無法被利用。

Hash 索引在任何時候都不能避免表掃描。前面已經知道，Hash 索引是將索引鍵通過 Hash 運算之后，將 Hash運算結果的 Hash 值和所對應的行指針信息存放於一個 Hash 表中，由於不同索引鍵存在相同 Hash 值，所以即使取滿足某個 Hash 鍵值的數據的記錄條數，也無法從 Hash 索引中直接完成查詢，還是要通過訪問表中的實際數據進行相應的比較，並得到相應的結果。

Hash 索引遇到大量Hash值相等的情況后性能並不一定就會比B+Tree索引高。對於選擇性比較低的索引鍵，如果創建 Hash 索引，那么將會存在大量記錄指針信息存於同一個 Hash 值相關聯。這樣要定位某一條記錄時就會非常麻煩，會浪費多次表數據的訪問，而造成整體性能低下

簡單地說，哈希索引就是采用一定的哈希算法，把鍵值換算成新的哈希值，檢索時不需要類似B+樹那樣從根節點到葉子節點逐級查找，只需一次哈希算法即可立刻定位到相應的位置，速度非常快。

如果是等值查詢，那么哈希索引明顯有絕對優勢，因為只需要經過一次算法即可找到相應的鍵值；當然了，這個前提是，鍵值都是唯一的。如果鍵值不是唯一的，就需要先找到該鍵所在位置，然后再根據鏈表往后掃描，直到找到相應的數據;
如果是范圍查詢檢索，這時候哈希索引就毫無用武之地了，因為原先是有序的鍵值，經過哈希算法后，有可能變成不連續的了，就沒辦法再利用索引完成范圍查詢檢索；
同理，哈希索引也沒辦法利用索引完成排序，以及like ‘xxx%’ 這樣的部分模糊查詢（這種部分模糊查詢，其實本質上也是范圍查詢）；
哈希索引也不支持多列聯合索引的最左匹配規則；
B+樹索引的關鍵字檢索效率比較平均，不像B樹那樣波動幅度大，在有大量重復鍵值情況下，哈希索引的效率也是極低的，因為存在所謂的哈希碰撞問題。

本站轉載的文章為個人學習借鑒使用，本站對版權不負任何法律責任。如果侵犯了您的隱私權益，請聯系本站郵箱yoyou2525@163.com刪除。

猜您在找 mysql索引為啥用b+樹而不用b樹 MySQL B+樹索引和哈希索引的區別為什么Mysql用B+樹做索引而不用B-樹或紅黑樹 MySQL 索引與 B+ 樹 B+樹索引和哈希索引的區別——我在想全文搜索引擎為啥不用hash索引而非得使用B+呢？ MySQL索引：B+樹索引 MySQL為什么用B+樹，而不用B樹？ MySQL為什么要使用B+樹索引對B+樹與索引在MySQL中的認識 MySQL索引底層：B+樹詳解