數據庫索引、優化


參考地址:

如何看MS SQLSERVER數據庫的執行計划https://blog.csdn.net/luoyanqing119/article/details/17022649     

 

SQLserver索引的原理和應用https://www.cnblogs.com/knowledgesea/p/3672099.html

聚集索引和非聚集索引https://www.cnblogs.com/aspnethot/articles/1504082.html

數據庫SQL優化大總結之 百萬級數據庫優化方案https://www.cnblogs.com/yunfeifei/p/3850440.html

數據庫優化之程序操作優化https://www.cnblogs.com/AK2012/archive/2012/12/28/2012-122803.html

為什么不建議用select *?https://blog.csdn.net/u013240038/article/details/90731874

 

 上圖中,數據庫執行一個T-SQL發生的事,了解一下數據庫的構成以及功能。

執行計划:

  可以緩存,存儲過程/參數化查詢

  select * from User where id=1

  select * from User where id=2

  select * from User where id=@id

數據是什么?

  數據庫就是把東西有序放好,還能隨時找到的一個工具。應用程序,有序的數據管理,數據在硬盤上(持久化,唯一的,多線程操作需要加鎖,速度慢,可以SSD加快速度)。char nvarchar字段最長是8kb。

聚集索引

  舉個例子,在圖書館中,就是書多。圖書館是怎么分類的呢?文學、武俠、IT.....每個類別還有很多書啊,就按照首字母排序。新華字典文字都是按照字母排序的。聚集索引也叫聚簇索引,把數據有序的拜訪,物理排序,找字母a開頭,找時間范圍的。。。

  SQLserver自增int,默認聚集索引,所以查詢不排序,就是Id排序。換聚集索引很耗時,很多的硬盤操作,生產環境需要謹慎。聚集索引只有一個,但是生成聚集索引的可以有多個列。一般是自增主鍵/創建時間/價格。因為數據物理排序了,所以查詢快,非常適合大於、小於、between order by。

  聚集索引速度大於非聚集索引

非聚集索引

  在新華字典中,偏旁部首查找漢子---找頁碼----看詳情。圖書館電子查找,輸入名字---樓層----書架---層。

  特點:重復存儲值和路徑,體積小一些,所以查找快一些,快速定位,直達目標。不影響數據的物理排序,但是會重復存儲一個數據和位置。

  找數據:先找索引----快速定位-----拿到數據,查找快,但是有維護的索引的成本,請小心。

  非聚集索引可以有很多個,好像最多個255個,每個索引也可以有很多個字段,建議索引不要超過10個。適合經常查詢的字段。非聚集索引不能運算,不能like'% %',也不能where Id-1>10。like 'a%'這個是可以用非聚集索引的。

建議索引的原則/建議:

  1、主鍵是必須建立索引的(推薦數值主鍵,性能最高)

  2、外鍵也要索引,join能提升性能

  3、經常查詢的字段建立索引

  4、經常在where里面的也要建立索引

  5、order by 、group by、distinct

  6、聚合運算/where條件時,先索引字段

不需要建立索引的:

  1、基本不怎么查詢的

  2、重復值比較傴的

  3、text/image不要索引

  4、索引不要太多了

還有其他的索引,主XML索引、輔助XML索引、空間索引、非聚集Columnstore索引(數量超過千萬的時間建立的索引,先出的一個東西吧)

 

   執行計划:

    提交SQL語句,數據庫查詢優化器,經過分析生成,指定多個查詢方式,從中算則使用資源最少的,數控制定執行計划是按照使用資源最少,而不是時間最短。

    1、Table Scan 全表掃描性能最差
    2、Cluster Index Scan (聚集索引的掃描) 性能最差,同上,雖然有聚集索引,其實也是全表掃描
    3、Index Seek(NonClustered)(索引查找) 性能非常高
    4、Index Scan 先Index 再掃描
    5、Cluster Index Seek 性能最高

常規的SQL優化建議

  1、對列的計算,任何形式都要避免

  2、in 查詢 or 查詢索引會失效,可能是拆分

  3、in 換 exists,not in 不要用,完全不走索引

  4、is null 和 is not null都不走索引,索引里面不保存null的

  5、<>這種也不走索引,可以拆分成< 和 >

  6、join時,連接越少,性能越高。左連接,以左邊的表結果為主;右連接,反過來;連接字段要求帶索引

 

當數據庫量達到上億之后,索引用處就不大了,SQLserver數據庫,兩千萬就可以了。當數據量過大,就應該從數據庫設計層次找問題了。

 


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM