什么是索引:
索引是一種高效獲取數據的存儲結構,例:hash、 二叉、 紅黑。
Mysql為什么不用上面三種數據結構而采用B+Tree:
若僅僅是 select * from table where id=45 , 上面三種算法可以輕易實現,但若是select * from table where id<6 , 就不好使了,它們的查找方式就類似於"全表掃描",因為他們的高度是不可控的(如下圖)。B+Tree的高度是可控的,mysql通常是3到5層。注意:B+Tree只在最末端葉子節點存數據,葉子節點是以鏈表的形勢互相指向的。
Myisam引擎(非聚集索引)
若以這個引擎創建數據庫表Create table user (…..),它實際是生成三個文件:
user.myi 索引文件 user.myd數據文件 user.frm數據結構類型。
如下圖:當我們執行 select * from user where id = 1的時候,它的執行流程。
(1)查看該表的myi文件有沒有以id為索引的索引樹。
(2)根據這個id索引找到葉子節點的id值,從而得到它里面的數據地址。(葉子節點存的是索引和數據地址)。
(3)根據數據地址去myd文件里面找到對應的數據返回出來。
Innodb引擎(聚集索引)
若以這個引擎創建數據庫表Create table user (…..),它實際是生成兩個文件:
user.ibd 索引文件 user.frm數據結構類型
因為innodb引擎創建表默認就是以主鍵為索引,所以不需要myi文件。
下圖為innodb表的結構圖:很顯然它與myisam最大的區別是將整條數據存在葉子節點,而不是地址。(葉子節點存的是主鍵索引和數據信息)
若此時,你在其他列創建索引例如name,它就會另外創建一個以name為索引的索引樹,(葉子節點存的是索引和主鍵索引)。
你在執行select * from user where name = ‘吳磊’,他的執行過程如下:
(1)找到name索引樹
(2)根據name的值找到該樹下葉子的name索引和主鍵值
(3)用主鍵值去主鍵索引樹去葉子節點到該條數據信息
MyISAM引擎和InnoDB引擎的區別
MyISAM:支持全文索引;不支持事務;它是表級鎖;會保存表的具體行數.
InnoDB:5.6以后才有全文索引;支持事務;它是行級鎖;不會保存表的具體行數.
一般:不用事務的時候,count計算多的時候適合myisam引擎。對可靠性要求高就是用innodby引擎。推薦用InnoDB引擎.
加了索引之后能夠大幅度的提高查詢速度,但是索引也不是越多越好,一方面它會占用存儲空間,另一方面它會使得寫操作變得很慢。通常我們對查詢次數比較頻繁,值比較多的列才建索引。
例如:select * from user where sex = "女", 這個就不需要建立索引,因為性別一共就兩個值,查詢本身就是比較快的。
select * from user where user_id = 1995 ,這個就需要建立索引,因為user_id的值是非常多的。
B+Tree的特性
(1)由圖能看出,單節點能存儲更多數據,使得磁盤IO次數更少。
(2)葉子節點形成有序鏈表,便於執行范圍操作。
(3)聚集索引中,葉子節點的data直接包含數據;非聚集索引中,葉子節點存儲數據地址的指針。