SQL SERVER大話存儲結構（4）_復合索引與包含索引

本文轉載自查看原文 2017-06-01 12:46 1835 包含索引/ SQL SERVER/ 復合索引

索引這塊從存儲結構來分，有2大類，聚集索引和非聚集索引，而非聚集索引在堆表或者在聚集索引表都會對其鍵值有所影響，這塊可以詳細查看本系列第二篇文章： SQL SERVER大話存儲結構_(2)_非聚集索引如何查找到行記錄。

非聚集索引內又分為多類：單列索引、復合索引、包含索引、過濾索引等。之前文章有具體分析過非聚集索引的存儲情況，但是沒有對復合索引及包含索引做過多說明，本文來講講這兩個索引。

如果轉載，請注明博文來源： www.cnblogs.com/xinysu/ ，版權歸博客園蘇家小蘿卜所有。望各位支持！

1 語法及說明

--復合索引
CREATE INDEX IndexName ON tbname(columna,columnb [,columnc...] )
 
--包含索引
CREATE INDEX IndexName ON tbname(columna [,columnb,columnc...] ) INCLUDE (column1 [,column2,column3...])

復合索引，顧名思義，及多個列組成的索引，列的順序非常重要，關系到查詢性能，這點后面會說明。

包含索引，建索引SQL 中含有 include 字段，索引鍵值用於WHERE條件過濾，INCLUDE字段用於 SELECT 展示，這點后面也會說明。

無論是符合索引還是包含索引，都有索引鍵值長度不能超過900字節的限制，但是要注意一點，包含索引的include字段是不包括在里邊的。

2 索引頁存儲情況

從索引頁的存儲情況來分析，分析過程中，重點在查看復合索引跟包含包含索引在子節點及葉子結點的鍵值情況。

2.1 創建測試表格

創建表格 tbindex，建立兩個測試索引，同時造數據。

 1 CREATE TABLE tbindex(
 2 id int identity(1,1) not null primary key ,
 3 name varchar(50) not null,
 4 type varchar(10) not null,
 5 numbers int not null
 6 )
 7 GO
 8  
 9 CREATE INDEX ix_number_name ON tbindex(numbers,name)
10 GO
11 CREATE INDEX ix_name ON tbindex(numbers) INCLUDE (name)
12 GO
13  
14 DECLARE @ID INT
15 SET @ID=1
16 WHILE @ID<=5
17 BEGIN
18      INSERT INTO tbindex(name,type,numbers)
19      SELECT
20            name,
21          type,
22          object_id+@id
23      FROM sys.objects
24  
25         SET @ID=@ID+1
26 END

2.2 分析索引行

--查看該表格索引的id情況
SELECT * FROM sys.indexes WHERE object_id=object_id('tbindex')
--PK__tbindex__3213E83F89582AC3    1
--ix_number_name    2
--ix_number    3
 
DBCC traceon(3604)
DBCC ind('dbpage','tbindex',-1)
 
DBCC PAGE('dbpage',1,395,3)
DBCC PAGE('dbpage',1,396,3)
 
DBCC PAGE('dbpage',1,397,3)
DBCC PAGE('dbpage',1,398,3)

分析查看，得知：

復合索引 IX_number_name的索引節點為pageid=395，再挑選一個葉子結點來分析 pageid=396；
包含索引 IX_number 的索引節點為 pageid=397，再挑選一個葉子節點來分析 pageid=398。

             
           --復合索引，395為索引頁節點，396為索引頁葉子節點 
         
           DBCC PAGE('dbpage',1,395,3) 
         
           DBCC PAGE('dbpage',1,396,3) 
         
           --包含索引，397為索引頁節點，398為索引頁葉子節點 
         
           DBCC PAGE('dbpage',1,397,3) 
         
           DBCC PAGE('dbpage',1,398,3)

從這里可以看出，復合索引跟包含索引的所有索引列都會存儲在索引葉子節點跟子節點，但是包含索引的INCLUDE列，不在索引頁的子節點存儲，僅存儲在索引頁的葉子節點上。

從這里不難理解，為什么之前說 include列用於 select 列，而不用於 where 列過濾。因為非聚集索引當索引頁面有多層的時候，是先查詢索引的子節點，再查詢索引的葉子節點，而包含索引的INCLUDE列不在葉子節點中存儲，無法根據其來進行過濾。

3 對查詢的影響

3.1 復合索引查詢注意事項

由於需要數據量作為實驗支持，所以不用之前分析索引行結構的表格tbindex，換個高大上 tb_composite 如下。

 1 create table tb_composite(
 2 id int identity(1,1) not null primary key,
 3 name varchar(50) not null,
 4 userid int not null,
 5 timepoint datetime not null
 6 )
 7 GO
 8  
 9 create index ix_userid_name on tb_composite(userid,name)
10 GO
11  
12 create index ix_userid on tb_composite(userid)
13 GO
14  
15 INSERT INTO tb_composite(name,userid,timepoint)
16 SELECT
17       newid(),orderid%10000 ,CreatedDate
18 FROM ORDERS

大數據表格

至此，測試表格建立完成，開始分析索引頁面信息，統計表格tb_composite信息如下：

 1 --查看表格的數據大小跟非聚集索引大小
 2 WITH DATA AS (
 3 SELECT
 4  
 5       O.name tb_name,
 6       reservedpages = SUM (reserved_page_count),
 7       usedpages = SUM (used_page_count),
 8       pages = SUM (CASE WHEN (index_id < 2) THEN (in_row_data_page_count + lob_used_page_count + row_overflow_used_page_count) ELSE 0 END ),
 9       rowCounts = SUM (CASE WHEN (index_id < 2) THEN row_count ELSE 0 END )
10 FROM sys.dm_db_partition_stats S
11 JOIN sys.objects o on s.object_id=o.object_id
12 WHERE O.type='U'
13 GROUP BY O.name
14 )
15 SELECT
16  
17          tb_name,
18          rowCounts,
19          reservedpages*8/1024 reserved_Mb,
20          pages*8/1024 data_Mb,
21          index_Mb=(usedpages-pages)*8/1024,
22          unused_Mb=case when usedpages>reservedpages then 0 else (reservedpages-usedpages)*8/1024 end
23 FROM DATA
24 WHERE tb_name = 'tb_composite'
25 ORDER BY reserved_Mb DESC
26 Go

           --詳細分析每一個索引的索引頁面數量 
         
           create table tbind(PageFID int,   PagePID int,IAMFID int,IAMPID int,ObjectID int,IndexID int,PartitionNumber int,PartitionID varchar(50),iam_chain_type varchar(50) ,PageType int,IndexLevel int,NextPageFID int,NextPagePID int,PrevPageFID int,PrevPagePID int ) 
         
           INSERT INTO TBIND EXEC ('DBCC IND(''yaochufa'',''tb_composite'',-1) ') 
         
           SELECT 
         
                 i.name,i.index_id,p.page_nums 
         
           FROM sys.indexes i join (SELECT IndexID,count(*) page_nums FROM tbind group by IndexID ) p on i.index_id=p.IndexID 
         
           WHERE object_id=object_id('tb_composite') 
         
           ORDER BY index_id

可以看到這個表格的非聚集索引總大小 ≈ 598Mb ≈ （43022+33279）*8k/1024 ≈ 596Mb 。

ix_userid_name 明顯要比 ix_userid 存儲的頁面多，這是因為 ix_userid_name 比 ix_userid 多存儲了 name 這個索引鍵值，索引頁的增加，意味着使用這個索引就會相應增加 IO 。

比如一下兩個SQL：

           SET STATISTICS IO ON 
         
           --執行前，按下快捷鍵：Ctrl+M, 執行SQL后會顯示實際執行的執行計划 （注意，Ctrl+L，則為 預估的執行計划） 
         
           SELECT * FROM tb_composite WITH(INDEX=ix_userid_name) WHERE userid =6500 
         
           SELECT * FROM tb_composite WITH(INDEX=ix_userid) WHERE userid =6500

查看其IO情況：

走復合索引會比單列索引要多出3個IO，userid 條件的擴大這個IO差別也會逐步加大。

查看執行計划如下：

可以看出，兩者都是先根據索引進行 index seek 查找到相應的索引行，再根據索引行上的主鍵，去聚集索引中進行 key lookup查找行記錄。兩者的執行計划是一模一樣的。這里加多一個SQL查詢。

           SELECT * FROM tb_composite WHERE name='6CDC4A13-36FF-4FA2-94D0-F1CBEA40852C' 
         

name這一列，不存在單列索引，存在於復合索引 ix_userid_name(userid,timepoint,name) 中，那么這個查詢能否根據這個索引進行查找呢？

答案是：NO NO NO ，數據庫會根據其IO情況來做選擇，有兩種可能，一種是根據主鍵做全表scan，另外一種是對復合索引進行 index scan 全掃描，然后再根據鍵值去聚集索引上查找相應的行記錄。

且看執行計划跟IO如下，可以看出，邏輯讀基本上把所有數據頁（聚集索引葉子節點）都掃描出來，一次IO是一個8kb的data page。

來吧，總結一下：

最左匹配原則：復合索引鍵值列假設為（a, b, c, d, e），則等同於索引這幾個索引：（a）、（a, b）、（a, b, c）、（a, b, c, d）、（a, b, c, d, e）
1. 當where條件符合最左匹配原則，那么，執行計划則是 INDEX SEEK ，走索引查找；
2. 當where條件不符合最左匹配原則，則根據性能評估，走primary index scan 或者非聚集索引掃描再根據鍵值去 primary key lookup ；
根據最左匹配原則，可以在日常管理中，避免添加一些冗余冗余索引
但是也有一個注意事項：隨着復合索引的列增加，索引頁也會增加，使用其索引會增加一定量的IO，所以，再判斷冗余索引的時候，需要考慮下這種情況，通常很少碰到這種情形。

3.2 復合索引與包含索引的查詢區別

前面測試已經了解復合索引跟包含索引的存儲結構，這里進行查詢測試。這里注意索引頁數量 = 索引節點頁+索引葉子節點頁。

先創建包含索引表格，造數據。

           CREATE TABLE tb_include( 
         
           id int identity(1,1) not null primary key, 
         
           name varchar(50) not null, 
         
           userid int not null, 
         
           timepoint datetime not null 
         
           ) 
         
           GO 
         
           CREATE INDEX ix_userid on tb_include(userid) INCLUDE (timepoint,name) 
         
           GO 
         
           INSERT INTO tb_include( name , userid , timepoint ) SELECT name,userid,timepoint FROM tb_composite 
         
           GO

做兩個查詢如下：

           SELECT USERID,name FROM tb_composite  where USERID=71 
         
           SELECT USERID,name FROM tb_include  where USERID=71 
         
           SELECT USERID,name FROM tb_composite  where USERID=71 AND NAME='010CC1BD-1736-46A8-9497-7F4DBFD082B2' 
         
           SELECT USERID,name FROM tb_include  where USERID=71 AND NAME='010CC1BD-1736-46A8-9497-7F4DBFD082B2'

總結：

如果where 條件包含include列
1. include列無法參與 index seek，因為其索引子節點不存在，只存在於索引葉子節點，所以include列一般都是展示列；
2. include列由於無法做 where 過濾的 index seed，同比復合索引，IO相對會較大
如果展示列僅限於索引鍵值及include列
1. 包含索引中，根據索引鍵值找到索引葉子節點后，無須根據主鍵值或者RID值回表去查詢行記錄，而是直接把索引葉子節點的 include 列的內容展示即可，減少回表的IO；
如果where條件僅含鍵值列，select 展示列僅含鍵值列級include列
1. 兩者性能基本一致，包含索引相對少IO，但是區別不大。
所有非聚集索引的限制長度是900個字節，但是包含索引中的 include列是不計算在索引長度中的，所以如果要是遇到這種索引超過 900 bytes的特殊情況，可以考慮把相關字段放到include中來處理。

免責聲明！

本站轉載的文章為個人學習借鑒使用，本站對版權不負任何法律責任。如果侵犯了您的隱私權益，請聯系本站郵箱yoyou2525@163.com刪除。

猜您在找 SQL SERVER大話存儲結構（2）_非聚集索引如何查找到行記錄 SQL Server 索引和表體系結構（包含列索引） SQL Server 索引結構 SQL Server索引--（包含列和覆蓋索引） SQL Server 索引（一）數據結構和存儲結構 sql復合索引的探索 SQL SERVER大話存儲結構（5）_SQL SERVER 事務日志解析 SQL Server創建復合索引時，復合索引列順序對查詢的性能影響 SQL Server創建復合索引時，復合索引列順序對查詢的性能影響 SQL SERVER大話存儲結構（3）_數據行的行結構