一、什么是索引?
索引是對數據庫表中的一列或多列值進行排序的一種結構,使用索引可以快速訪問數據庫表中的特定信息。
二、索引的作用?
索引相當於圖書上的目錄,可以根據目錄上的頁碼快速找到所需的內容,提高性能(查詢速度)
三、優點:
- 通過創建唯一性索引,可以保證數據庫表中的每一行數據的唯一性。
- 可以加快數據的檢索速度
- 可以加速表與表之間的連接
- 在使用分組和排序進行檢索的時候,可以減少查詢中分組和排序的時間
四、缺點
- 創建索引和維護索引要耗費時間,這種時間隨着數據量的增加而增加。
- 索引需要占用物理空間,數據量越大,占用空間越大
- 會降低表的增刪改的效率,因為每次增刪改索引,都需要進行動態維護
五、什么時候需要創建索引
- 主鍵自動建立唯一索引
- 頻繁作為查詢條件的字段應該創建索引
- 查詢中排序的字段創建索引將大大提高排序的速度(索引就是排序加快速查找
- 查詢中統計或者分組的字段;
六、什么時候不需要創建索引
- 頻繁更新的字段不適合創建索引,因為每次更新不單單是更新記錄,還會更新索引,保存索引文件
- where條件里用不到的字段,不創建索引;
- 表記錄太少,不需要創建索引;
- 經常增刪改的表;
- 數據重復且分布平均的字段,因此為經常查詢的和經常排序的字段建立索引。注意某些數據包含大量重復數據,因此他建立索引就沒有太大的效果,例如性別字段,只有男女,不適合建立索引。
七、索引的分類:
- 普通索引:最基本的索引,它沒有任何限制
- 唯一索引:索引列的值必須唯一,且不能為空,如果是組合索引,則列值的組合必須唯一。
- 主鍵索引:特殊的索引,唯一的標識一條記錄,不能為空,一般用primary key來約束。
- 聯合索引:在多個字段上建立索引,能夠加速查詢到速度
八、索引和sql語句的優化
1、前導模糊查詢不能使用索引,
如name like ‘%靜’
2、Union、in、or可以命中索引,建議使用in
3、負條件查詢不能使用索引,可以優化為in查詢,
其中負條件有!=、<>、not in、not exists、not like等
4、聯合索引最左前綴原則,又叫最左側查詢,
如果在(a,b,c)三個字段上建立聯合索引,那么它能夠加快a|(a,b)|(a,b,c)三組的查詢速度。
5、建立聯合查詢時,區分度最高的字段在最左邊
6、如果建立了(a,b)聯合索引,就不必再單獨建立a索引。
同理,如果建立了(a,b,c)索引就不必再建立a,(a,b)索引
7、存在非等號和等號混合判斷條件時,在建索引時,要把等號條件的列前置
8、范圍列可以用到索引,但是范圍列后面的列無法用到索引。
索引最多用於一個范圍列,如果查詢條件中有兩個范圍列則無法全用到索引。范圍條件有:<、<=、>、>=、between等。
9、把計算放到業務層而不是數據庫層。
在字段上計算不能命中索引,
10、強制類型轉換會全表掃描,
如果phone字段是varcher類型,則下面的SQL不能命中索引。Select * fromuser where phone=13800001234
11、更新十分頻繁、數據區分度不高的字段上不宜建立索引。
更新會變更B+樹,更新頻繁的字段建立索引會大大降低數據庫性能。
“性別”這種區分度不太大的屬性,建立索引是沒有什么意義的,不能有效過濾數據,性能與全表掃描類似。
一般區分度在80%以上就可以建立索引。區分度可以使用count(distinct(列名))/count(*)來計算。
12、利用覆蓋索引來進行查詢操作,避免回表。
被查詢的列,數據能從索引中取得,而不是通過定位符row-locator再到row上獲取,即“被查詢列要被所建的索引覆蓋”,這能夠加速度查詢。
13、建立索引的列不能為null,使用not null約束及默認值
14、利用延遲關聯或者子查詢優化超多分頁場景,
MySQL並不是跳過offset行,而是取offset+N行,然后放棄前offset行,返回N行,那當offset特別大的時候,效率非常低下,要么控制返回的總數,要么對超過特定閾值的頁進行SQL改寫。
15、業務上唯一特性的字段,即使是多個字段的組合,也必須建成唯一索引。
16、超過三個表最好不要用join,
需要join的字段,數據類型必須一致,多表關聯查詢時,保證被關聯的字段需要有索引。
17、如果明確知道查詢結果只要一條,limit 1能夠提高效率,比如驗證登錄的時候。
18、Select語句務必指明字段名稱
19、如果排序字段沒有用到索引,就盡量少排序
20、盡量用union all 代替 union。
Union需要將集合合並后在進行唯一性過濾操作,這會涉及到排序,大量的cpu運算,加大資源消耗及延遲,當然,使用union all的前提條件是兩個結果集沒有重復數據。
21、使用合理的分頁提高效率。
select id,name from product limit 866613, 20
使用上述SQL語句做分頁的時候,可能有人會發現,隨着表數據量的增加,直接使用limit分頁查詢會越來越慢。
優化的方法如下:
可以取前一頁的最大行數的id,然后根據這個最大的id來限制下一頁的起點。
比如此列中,上一頁最大的id是866612。
SQL可以采用如下的寫法:select id,name from product where id> 866612 limit 20。