主鍵索引和非主鍵索引的區別


轉自 https://www.cnblogs.com/heishuichenzhou/p/10813463.html

1. 什么是最左前綴原則?

以下回答全部是基於MySQL的InnoDB引擎

例如對於下面這一張表

 

如果我們按照 name 字段來建立索引的話,采用B+樹的結構,大概的索引結構如下

 

如果我們要進行模糊查找,查找name 以“張"開頭的所有人的ID,即 sql 語句為

select ID from table where name like '張%'

由於在B+樹結構的索引中,索引項是按照索引定義里面出現的字段順序排序的,索引在查找的時候,可以快速定位到 ID 為 100的張一,然后直接向右遍歷所有開頭的人,直到條件不滿足為止。

也就是說,我們找到第一個滿足條件的人之后,直接向右遍歷就可以了,由於索引是有序的,所有滿足條件的人都會聚集在一起。

而這種定位到最左邊,然后向右遍歷尋找,就是我們所說的最左前綴原則

2. 為什么用 B+ 樹做索引而不用哈希表做索引?

1、哈希表是把索引字段映射成對應的哈希碼然后再存放在對應的位置,這樣的話,如果我們要進行模糊查找的話,顯然哈希表這種結構是不支持的,只能遍歷這個表。而B+樹則可以通過最左前綴原則快速找到對應的數據。

2、如果我們要進行范圍查找,例如查找ID為100 ~ 400的人,哈希表同樣不支持,只能遍歷全表。

3、索引字段通過哈希映射成哈希碼,如果很多字段都剛好映射到相同值的哈希碼的話,那么形成的索引結構將會是一條很長的鏈表,這樣的話,查找的時間就會大大增加。

3. 主鍵索引和非主鍵索引有什么區別?

例如對於下面這個表(其實就是上面的表中增加了一個k字段),且ID是主鍵。

 

主鍵索引和非主鍵索引的示意圖如下:

 

其中R代表一整行的值。

從圖中不難看出,主鍵索引和非主鍵索引的區別是:非主鍵索引的葉子節點存放的是主鍵的值,而主鍵索引的葉子節點存放的是整行數據,其中非主鍵索引也被稱為二級索引,而主鍵索引也被稱為聚簇索引

根據這兩種結構我們來進行下查詢,看看他們在查詢上有什么區別。

1、如果查詢語句是 select * from table where ID = 100,即主鍵查詢的方式,則只需要搜索 ID 這棵 B+樹。

2、如果查詢語句是 select * from table where k = 1,即非主鍵的查詢方式,則先搜索k索引樹,得到ID=100,再到ID索引樹搜索一次,這個過程也被稱為回表。

現在,知道他們的區別了吧?

4. 為什么建議使用主鍵自增的索引?

對於這顆主鍵索引的樹

 

如果我們插入 ID = 650 的一行數據,那么直接在最右邊插入就可以了

 

但是如果插入的是 ID = 350 的一行數據,由於 B+ 樹是有序的,那么需要將下面的葉子節點進行移動,騰出位置來插入 ID = 350 的數據,這樣就會比較消耗時間,如果剛好 R4 所在的數據頁已經滿了,需要進行頁分裂操作,這樣會更加糟糕。

但是,如果我們的主鍵是自增的,每次插入的 ID 都會比前面的大,那么我們每次只需要在后面插入就行, 不需要移動位置、分裂等操作,這樣可以提高性能。也就是為什么建議使用主鍵自增的索引。


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM