面試知識,數據庫索引優化


問什么問題?

  1. 索引有什么代價?哪些場景下你需要建索引?或者有時候反過來問,哪些場景下不推薦建索引。
  2. 建好索引之后,怎么才能最高效地利用索引?或者反過來問,請說出一個無法有效利用已建索引的案例。

索引的好處?

快速查詢數據。

代價是什么?

  1. 索引需要占硬盤空間,這是空間方面的代價。
  2. 一旦插入新的數據,就需要重新建索引,這是時間上的代價。

不同場景,不同對待。

場景一,數據表規模不大,就幾千行,即使不建索引,查詢語句的返回時間也不長,這時建索引的意義就不大。當然,若就幾千行,索引所占的空間也不多,所以這種情況下,頂多屬於“性價比”不高。

場景二,某個商品表里有幾百萬條商品信息,同時每天會在一個時間點,往其中更新大概十萬條左右的商品信息,現在用where語句查詢特定商品時(比如where name = ‘XXX’)速度很慢。為了提升查詢效率可以建索引,但當每天更新數據時,又會重建索引,這是要耗費時間的。這時就需要綜合考慮,甚至可以在更新前刪除索引,更新后再重建。

場景三,因為在數據表里ID值都不相同,所以索引能發揮出比較大的作用。相反,如果某個字段重復率很高,如性別字段,或者某個字段大多數值是空(null),那么不建議對該字段建索引。

建立索引原則

一定是有業務需求了才會建索引。比如在一個商品表里,我們經常要根據name做查詢,如果沒有索引,查詢速度會很慢,這時就需要建索引。但在項目開發中,如果不經常根據商品編號查詢,那么就沒必要對編號建索引。

最后再強調一次,建索引是要付出代價的,沒事別亂建着玩,同時在一個表上也不能建太多的索引。

具體的例子來看索引的正確用法

  1. 語句一:select name from 商品表。不會用到索引,因為沒有where語句。
  2. 語句二:select * from 商品表 where name = ‘Java書’,會用到索引,如果項目里經常用到name來查詢,且商品表的數據量很大,而name值的重復率又不高,那么建議建索引。
  3. 語句三:select * from 商品表 where name like ‘Java%’ 這是個模糊查詢,會用到索引,請大家記住,用like進行模糊查詢時,如果第一個就是模糊的匹配符,比如where name like ‘%java’,那么在查詢時不會走索引。在其他情況下,不論用了多少個%,也不論%的位置,只要不出現在第一個位置,那么都能用到索引。

學生成績表里有兩個字段:姓名和成績。現在對成績這個整數類型的字段建索引。

  1. 第一種情況,當數字型字段遇到非等值操作符時,無法用到索引。比如:

​ select name from 學生成績表 where 成績>95 , 一旦出現大於符號,就不能用到索引,為了用到索引,我們應該改一下SQL語句里的where從句:where 成績 in (96,97,98,99,100)

  1. 第二種情況,如果對索引字段進行了某種左值操作,那么無法用到索引。

​ 能用到索引的寫法:select name from 學生成績表 where 成績 = 60

​ 不能用到索引的寫法:select name from 學生成績表 where 成績+40 = 100

  1. 第三種情況,如果對索引字段進行了函數操作,那么無法用到索引。

​ 比如SQL語句:select * from 商品表 where substr(name) = ‘J’,我們希望查詢商品名首字母是J的記錄,可一旦針對name使用函數,即使name字段上有索引,也無法用到。

看一些圖

非聚集索引和聚集索引的區別在於, 通過聚集索引可以查到需要查找的數據, 而通過非聚集索引可以查到記錄對應的主鍵值 , 再使用主鍵的值通過聚集索引查找到需要的數據。
不管以任何方式查詢表, 最終都會利用主鍵通過聚集索引來定位到數據, 聚集索引(主鍵)是通往真實數據所在的唯一路徑。

后記

不少程序員平時用過索引,但不知道怎么說,這很吃虧。對於高級程序員而言,如果你這都說不好,那么你的能力比初級的要高多少?對於初級程序員而言,如果你掌握了,而且能在面試中很好地說,那么你和同等能力的人相比,就很占優勢。


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM