mysql索引:四種類型,兩種方法


1. 普通索引:最基本的索引,它沒有任何限制,用於加速查詢。

2. 唯一索引unique:索引列的值必須唯一,但允許有空值。如果是組合索引,則列值的組合必須唯一。

3. 主鍵索引: 是一種特殊的唯一索引,一個表只能有一個主鍵,不允許有空值。一般是在建表的時候同時創建主鍵索引。

4. 空間索引Spatial :空間索引是對空間數據類型的字段建立的索引,MYSQL中的空間數據類型有4種,分別是GEOMETRY、POINT、LINESTRING、POLYGON。MYSQL使用SPATIAL關鍵字進行擴展,使得能夠用於創建正規索引類型的語法創建空間索引。創建空間索引的列,必須將其聲明為NOT NULL,空間索引只能在存儲引擎為MYISAM的表中創建

5. 全文索引fulltext: 主要用來查找文本中的關鍵字,而不是直接與索引中的值相比較。fulltext索引跟其它索引大不相同,它更像是一個搜索引擎,而不是簡單的where語句的參數匹配。

 

Hash 索引結構的特殊性,其檢索效率非常高,索引的檢索可以一次定位,不像B-Tree 索引需要從根節點到枝節點,最后才能訪問到頁節點這樣多次的IO訪問,所以 Hash 索引的查詢效率要遠高於 B-Tree 索引。
可能很多人又有疑問了,既然 Hash 索引的效率要比 B-Tree 高很多,為什么大家不都用 Hash 索引而還要使用 B-Tree 索引呢?任何事物都是有兩面性的,Hash 索引也一樣,雖然 Hash 索引效率高,但是 Hash 索引本身由於其特殊性也帶來了很多限制和弊端,主要有以下這些。

(1)Hash 索引僅僅能滿足"=","IN"和"<=>"查詢,不能使用范圍查詢。

由於 Hash 索引比較的是進行 Hash 運算之后的 Hash 值,所以它只能用於等值的過濾,不能用於基於范圍的過濾,因為經過相應的 Hash 算法處理之后的 Hash 值的大小關系,並不能保證和Hash運算前完全一樣。

(2)Hash 索引無法被用來避免數據的排序操作。

由於 Hash 索引中存放的是經過 Hash 計算之后的 Hash 值,而且Hash值的大小關系並不一定和 Hash 運算前的鍵值完全一樣,所以數據庫無法利用索引的數據來避免任何排序運算;

(3)Hash 索引不能利用部分索引鍵查詢。

對於組合索引,Hash 索引在計算 Hash 值的時候是組合索引鍵合並后再一起計算 Hash 值,而不是單獨計算 Hash 值,所以通過組合索引的前面一個或幾個索引鍵進行查詢的時候,Hash 索引也無法被利用。

(4)Hash 索引在任何時候都不能避免表掃描。

前面已經知道,Hash 索引是將索引鍵通過 Hash 運算之后,將 Hash運算結果的 Hash 值和所對應的行指針信息存放於一個 Hash 表中,由於不同索引鍵存在相同 Hash 值,所以即使取滿足某個 Hash 鍵值的數據的記錄條數,也無法從 Hash 索引中直接完成查詢,還是要通過訪問表中的實際數據進行相應的比較,並得到相應的結果。

(5)Hash 索引遇到大量Hash值相等的情況后性能並不一定就會比B-Tree索引高。

對於選擇性比較低的索引鍵,如果創建 Hash 索引,那么將會存在大量記錄指針信息存於同一個 Hash 值相關聯。這樣要定位某一條記錄時就會非常麻煩,會浪費多次表數據的訪問,而造成整體性能低下

 
 
2. B-Tree索引 
      B-Tree 索引是 MySQL 數據庫中使用最為頻繁的索引類型,除了 Archive 存儲引擎之外的其他所有的存儲引擎都支持 B-Tree 索引。不僅僅在 MySQL 中是如此,實際上在其他的很多數據庫管理系統中B-Tree 索引也同樣是作為最主要的索引類型,這主要是因為 B-Tree 索引的存儲結構在數據庫的數據檢 索中有非常優異的表現。        一般來說, MySQL 中的 B-Tree 索引的物理文件大多都是以 Balance Tree 的結構來存儲的,也就是所有實際需要的數據都存放於 Tree 的 Leaf Node ,而且到任何一個 Leaf Node 的最短路徑的長度都是完全相同的,所以我們大家都稱之為 B-Tree 索引當然,可能各種數據庫(或 MySQL 的各種存儲引擎)在存放自己的 B-Tree 索引的時候會對存儲結構稍作改造。如 Innodb 存儲引擎的 B-Tree 索引實際使用的存儲結構實際上是 B+Tree ,也就是在 B-Tree 數據結構的基礎上做了很小的改造,在每一個  Leaf Node 上面出了存放索引鍵的相關信息之外,還存儲了指向與該 Leaf Node 相鄰的后一個 LeafNode 的指針信息,這主要是為了加快檢索多個相鄰 Leaf Node 的效率考慮。        在 Innodb 存儲引擎中,存在兩種不同形式的索引,一種是 Cluster 形式的主鍵索引( Primary Key ),另外一種則是和其他存儲引擎(如 MyISAM 存儲引擎)存放形式基本相同的普通 B-Tree 索引,這種索引在 Innodb 存儲引擎中被稱為 Secondary Index 。下面我們通過圖示來針對這兩種索引的存放  形式做一個比較。 
     
      圖示中左邊為 Clustered 形式存放的 Primary Key ,右側則為普通的 B-Tree 索引。兩種 Root Node 和 Branch Nodes 方面都還是完全一樣的。而 Leaf Nodes 就出現差異了。在 Prim中, Leaf Nodes 存放的是表的實際數據,不僅僅包括主鍵字段的數據,還包括其他字段的數據據以主鍵值有序的排列。而 Secondary Index 則和其他普通的 B-Tree 索引沒有太大的差異,Leaf Nodes 出了存放索引鍵 的相關信息外,還存放了 Innodb 的主鍵值。 
      所以,在 Innodb 中如果通過主鍵來訪問數據效率是非常高的,而如果是通過 Secondary Index 來訪問數據的話, Innodb 首先通過 Secondary Index 的相關信息,通過相應的索引鍵檢索到 Leaf Node之后,需要再通過 Leaf Node 中存放的主鍵值再通過主鍵索引來獲取相應的數據行。MyISAM 存儲引擎的主鍵索引和非主鍵索引差別很小,只不過是主鍵索引的索引鍵是一個唯一且非空 的鍵而已。而且 MyISAM 存儲引擎的索引和 Innodb 的 Secondary Index 的存儲結構也基本相同,主要的區別只是 MyISAM 存儲引擎在 Leaf Nodes 上面出了存放索引鍵信息之外,再存放能直接定位到 MyISAM 數據文件中相應的數據行的信息(如 Row Number ),但並不會存放主鍵的鍵值信息
索引是數據庫中用來提高性能的最常用工具。所有MySql列類型都可以被索引。索引用於快速找出在某個列中有一特定值的行。如果不使用索引,MYSQL必須從第一條記錄開始然后讀完整個表直到找出相關的行。常用的包括BTREE索引和HASH索引。

創建的語句:

CREATE [UNIQUE|FULLTEXT|SPATIAL] INDEX index_name [USING index_type]
on tbl_nam(index_col_name,……)
1
2
3
1
2
3
刪除索引語句:

DROP INDEX index_name ON tbl_name
1
2
1
2
設計索引的規則:

最適合索引的列是出現在where子句中的列,或連接子句中指定的列,而不是出現在select關鍵字后的選擇列表中的列。
索引的列的基數越大,索引的效果越好。
盡量使用短索引。能夠節省大量索引空間,也可能使查詢更快。
不要過度索引。索引都要占用額外的磁盤空間,並降低寫操作的性能。在修改表的內容時,索引必須進行更新,有時可能需要重構。
BTREE索引和HASH索引的比較
1、B-Tree索引

索引存儲的值按索引列中的順序排列。可以用B-Tree索引進行全關鍵字、關鍵字范圍和關鍵字前綴查詢。如果使用索引,必須保證按索引最左邊前綴進行查詢。由於B樹中節點是順序存儲的,可以對查詢結果進行order by。

限制:

1)查詢必須從索引的最左邊的列開始

2)不能跳過某一索引列。

3)存儲引擎不能使用索引中范圍條件右邊的列。

例如,如果你的查詢語句為WHERE last_name=”Smith” AND first_name LIKE ‘J%’ AND dob=’1976-12-23’,則該查詢只會使用索引中的前兩列,因為LIKE是范圍查詢。

2、Hash索引
MySQL中只有Memory存儲引擎顯示支持hash索引,是默認索引類型,它也支持B-Tree索引。

如果多個值有相同的hash code,索引把它們的行指針用鏈表保存到同一個hash表項中。
因為索引自己僅僅存儲很短的值,所以索引非常緊湊,hash值不取決於列的數據類型,
int列的索引和長字符串列的索引一樣大。

3、總結

HASH索引適合等式比較的操作,不能用來加速order by操作,也不能確定在兩個值之間大約有多少行,會影響一些查詢的執行效率。而且只能使用整個關鍵字來搜索一行。
BTREE索引,使用大於,小於,BETWEEN,不等於,LIKE等操作符的時候都可以用。對索引字段進行范圍查詢的時候,只有BTREE索引可以通過索引訪問。HASH索引實際上是全表掃描的。
如果對多列進行索引,列的順序非常重要,MySQL僅能對索引最左邊的前綴進行有效查找。

假設存在組合索引it1c1c2(c1,c2),查詢語句select * from t1 where c1=1 and c2=2能夠
使用該索引。查詢語句select * from t1 where c1=1也能夠使用該索引。
但是,查詢語句select * from t1 where c2=2不能夠使用該索引,
因為沒有組合索引的引導列,即,要想使用c2列進行查找,必需出現c1等於某值。

索引是在存儲引擎中實現的,不是在服務器層中實現的。所以,每種存儲引擎的索引都不
一定完全相同,並不是所有的存儲引擎都支持所有的索引類型。

高性能索引策略
1、聚簇索引
聚簇索引保證關鍵字的值相近的元組存儲的物理位置也相同(所以字符串類型不宜建立聚簇索引,
特別是隨機字符串,會使得系統進行大量的移動操作),且一個表只能有一個聚簇索引。
因為由存儲引擎實現索引,所以,並不是所有的引擎都支持聚簇索引。
目前,只有solidDB和InnoDB支持。

2、覆蓋索引

索引的使用
1)索引不會包含有null值得列

2)盡量使用短索引,對串列進行索引,如果可能應該指定一個前綴長度。短索引不僅可以提高查詢速度而且可以節省磁盤空間和IO操作

3)like語句操作:like “%aaa%” 不會使用索引而like “aaa%”可以使用索引。

4)不要在列上進行運算
例如:select * from users where YEAR(adddate)<2007,將在每個行上進行運算,這將導致索引失效而進行全表掃描,因此我們可以改成:select * from users where adddate<’2007-01-01′。

使用限制:
1)由於索引僅包含hash code和記錄指針,所以,MySQL不能通過使用索引避免讀取記錄。但是訪問內存中的記錄是非常迅速的,不會對性能造成太大影響

2)不能使用hash索引排序。

3)Hash索引不支持鍵的部分匹配,因為是通過整個索引值來計算hash值的。

4)Hash索引只支持等值比較,例如使用=,IN( )和<=>。對於WHERE price>100並不能加速查詢。
————————————————
版權聲明:本文為CSDN博主「lovezhaohaimig」的原創文章,遵循 CC 4.0 BY-SA 版權協議,轉載請附上原文出處鏈接及本聲明。
原文鏈接:https://blog.csdn.net/lovezhaohaimig/article/details/80303613


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM