SQL Server基礎之索引


 索引用於快速找出在某個列中有某一特定值的行,不使用索引,數據庫必須從第一條記錄開始讀完整個表,直到找出相關的行。表越大,查詢數據所花費的時間越多,如果表中查詢的列有一個索引,數據庫能快速到達一個位置去搜索數據,本篇主要介紹與索引相關的內容,包括索引的含義和特點,索引的分類,索引的設計原則以及如何創建和刪除索引。

一:索引的含義和特點

 索引是一個單獨的,存儲在磁盤上的數據結構,它們包含則對數據表里所有記錄的引用指針,使用索引用於快速找出在某個或多個列中有某一特定值的行,對相關列使用索引是降低查詢操作時間的最佳途徑。索引包含由表或視圖中的一列或多列生成的鍵。

 例如:數據庫中有20000條記錄,現在要執行這樣一個查詢:SELECT * FROM tableName WHERE num=10000。如果沒有索引,必須遍歷整個表,直到num=10000的這一行為止;如果在num列上創建索引,SQL Server不需要任何掃描,直接在索引里面找10000,就可以得知這一行的位置。可見,索引的建立可以加快數據的查詢速度。

索引的優點主要有以下幾條:

 (1).通過創建唯一索引,可以保證數據庫表的每一行數據的唯一性。

 (2).可以大大加快數據的查詢速度,這也是創建索引的最主要的原因。

 (3).實現數據的參照完整性,可以速表和表之間的連接。

 (4).在使用分組和排序子句進行查詢時,也可以顯著減少查詢中分組和排序的時間。

同時,增加索引也有不利的一面:

 (1).創建索引和維護索引要耗費時間,並且隨着數據量的增加所耗費的時間也會增加。

 (2).索引需要占磁盤空間,除了數據表占數據空間之外,每一個索引還要占一定的物理空間,如果有大量的索引,索引文件可能比數據文件更快達到做大文件尺寸。

 (3).當對表中的數據進行增加,刪除和修改的時候,索引也要動態地維護,這樣就就降低了數據的維護速度。

二:索引的分類

 不同數據庫中提供了不同的索引類型,SQL Server中的索引有兩種:聚集索引和非聚集索引。它們的區別是在物理數據的存儲方式上。

1.聚集索引 

  聚集索引基於數據行的鍵值,在表內排序和存儲這些數據行。每個表只能有一個聚集索引,因為數據行本身只能按一個順序存儲。

 (1).每個表只能有一個聚集索引;

 (2). 表中的物理順序和索引中行的物理順序是相同的,創建任何非聚集索引之前要首先創建聚集索引,這是因為非聚集索引改變了表中行的物理順序;

 (3).關鍵值的唯一性使用UNIQUE關鍵字或者由內部的唯一標識符明確維護。

 (4).在索引的創建過程中,SQL Server臨時使用當前數據庫的磁盤空間,所以要保證有足夠的空間創建索引。

2.非聚集索引

 非聚集索引具有完全獨立於數據行的結構,使用非聚集索引不用將物理數據頁中的數據按列排序,非聚集索引包含索引鍵值和指向表數據存儲位置的行定位器。

 可以對表或索引視圖創建多個非聚集索引。通常,設計非聚集索引是為了改善經常使用的、沒有建立聚集索引的查詢的性能。

 查詢優化器在搜索數據值時,先搜索非聚集索引以找到數據值在表中的位置,然后直接從該位置檢索數據。這使得非聚集索引成為完全匹配查詢的最佳選擇,因為索引中包含搜索的數據值在表中的精確位置的項。

 具有以下特點的查詢可以考慮使用非聚集索引:

  (1).使用JOIN或者GROUP BY子句,應為連接和分組操作中所涉及的列創建多個非聚集索引,為任何外鍵創建一個聚集索引.

  (2).包含大量唯一值的字段。

  (3).不返回大型結果集的查詢。創建篩選索引以覆蓋從大型表中返回定義完善的的行子集的查詢。

  (4).經常包含在查詢的搜索條件(如返回完全匹配的WHERE子句)中的列。

3.其它索引

 除了聚集索引和非聚集索引之外,SQL Server中還提供了其它的索引類型。 

唯一索引:確保索引鍵不包含重復的值,因此,表或視圖中的每一行在某種程度上是唯一的。聚集索引和非聚集索引都可以是唯一索引。這種唯一性和主鍵約束是關聯的,在某種程度上,主鍵約束等於唯一性的聚集索引。

包含列索引:一種非聚集索引,它擴展后不僅包含鍵列,還包含非堅列。

索引視圖:在視圖上添加索引后能提高視圖的查詢效率。視圖的索引將具體化視圖,並將結果集永久存儲在唯一的聚集索引中,而且存儲方式相同,創建聚集索引后,可以為視圖添加非聚集索引。

全文索引:一種特殊類型的基於標記的功能索引,由SQL Server全文引擎生成和維護,用於幫助在字符串數據中搜索復雜的詞,這種索引的結構與數據庫引擎使用的聚集索引或非聚集索引的B樹結構是不同的。

空間索引:一種針對geometry數據類型的列上建立的索引,這樣可以更高效的列中的空間對象執行某些操作,空間索引可以減少需要應用開銷相對較大的空間操作的對象數。

篩選索引:一種經過優化的的非聚集索引,尤其適用於涵蓋從定義完善的數據子集中選擇數據的查詢。篩選索引使用篩選謂詞對表中的的部分進行索引,與全表索引相比,設計良好的篩選索引可以提高查詢性能,減少索引維護開銷並可降低索引存儲開銷

XML索引:是與XML數據關聯的索引形式,是XML二進制大對象(BLOB)的已拆分持久表示形式,XML索引可以分為主索引和輔助索引。

三:索引的設計原則

 索引設計不合理或者缺少索引都會對數據庫和應用程序的性能造成障礙,高效的索引對於獲得良好的性能非常重要。設計索引時,應該考慮以下原則:

 (1).索引並非越多越好,一個表中如果有大量的索引,不僅占用大量的磁盤空間,而且會影響INSERT、DELETE、UPDATE等語句的性能。因為當表中數據更改的同時,索引也會進行調整和更新。

 (2).避免對經常更新的表進行過多的索引,並且索引中的列盡可能少。而對經常用於查詢的字段應該創建索引,但要避免添加不必要的字段。

 (3).數據量小的表最好不要使用索引,由於數據較少,查詢花費的時間可能比遍歷索引的時間還要短,索引可能不會產生優化效果。

 (4).在條件表達式中經常用到的、不同值較多的列上建立索引,在不同值較少的列上不要建立索引、比如在學生表的【性別】

字段上只有【男】或【女】兩個不同值,因此就無需建立索引,如果建立索引,不但不會提高查詢效率,反而會嚴重降低更新速度。 

  (5).當唯一性是某種數據本身的特征時,指定唯一索引,使用唯一索引能夠確保定義的列的數據完整性,提高查詢速度。

 (6).在頻繁進行排序或分組(即進行GROUP BY 或ORDER BY操作)的列上建立索引,如果待排序的列有多個,可以在這些列上建立組合索引。

四:創建索引

 在了解了不同索引類型后,下面開始介紹如何使用T_SQL創建索引:

  CREATE INDEX命令既可以創建一個改變表的物理順序的聚集索引,也可以創建提高查詢性能的非聚集索引。語法如下:

  CREATE [UNIQUE] [CLUSTERED   |    NONCLUSTERRED]

  INDEX index_name ON {table | view }(column [ASC | DESC ]  [,...n])

  [ INCLUDE ( column_name [ ,...n])]

  [with

   (

    PAD_INDEX={ON | OFF}

    | FILLFACTOR =fillfactor

    | SORT_IN_TEMPDB={ ON | OFF}

    |  IGNORE_DUP_KEY ={ ON  | OFF}

    |  STATISRICS_NORECOMPUTE ={ ON | OFF}

    |   DROP_EXISTING = { ON | OFF}

    |  ONLINE ={ ON | OFF}

    |  ALLOW_ROW_LOCKS ={ ON | OFF}

    |  ALLOW_PAGE_LOCKS={ ON   | OFF}

    |  MAXDOP =max_degree_of_parallelism     

   ) [,...n] ]

UNIQUE:表示在表或視圖上創建唯一索引。唯一索引不允許兩行具有相同的索引鍵值。視圖的聚集索引必須唯一。

CLUSTERED:表示創建聚集索引,在創建任何非聚集索引之前創建聚集索引,創建聚集索引時會重新生成表中現有的非聚集索引。如果沒有指定CLUSTERED,則創建非聚集索引。

NONCLUSTERED:表示創建一個非聚集索引,非聚集索引數據行的物理順序獨立於與索引排序,每個表最多可包含999個非聚集索引,NONCLUSTERED是CREATE INDEX的默認值。

index_name:指定索引的名稱,索引名稱在表或視圖中必須唯一,但在數據庫中可不必唯一。

ON{table | view }:指定索引所屬的表或視圖。

Column:指定索引基於一列或者多列。指定兩個或者多個列名,可為指定的列的組合值創建組合索引,{table | view}后的括號中,按排序優先級列出組合索引要包括的列。一個組合索引鍵中最多可組合16列。組合索引鍵中的所有列必須在同一個表或視圖中。

[ASC | DESC]:指定索引列的升序或降序排序方向,默認為ASC。

INCLUDE(column[,...n]):指定要添加到非聚集索引的葉級別的非鍵列。

PAD_INDEX:表示指定索引填充,默認值為OFF。ON值表示fillfactor指定的可用空間百分比應用於索引的中間級頁。

FILLFACTOR=fillfactor:制定一個百分比,表示在索引創建或重新生成過程中數據庫引擎應使每個索引頁的葉級別達到的填充程度。fillfactor必須為介於1至100直接的整數值,默認值為0;

SORT_IN_TESTDB:指定是否在tempdb中存儲臨時排序結果,默認值為OFF,ON值表示在tempdb中存儲用於生成索引的中間排序結果,OFF表示中間排序結果與索引存儲在同一數據庫中。

IGNORE_DUP_KEY:指定唯一聚集索引或唯一非聚集索引執行多行插入操作時,出現重復鍵值的錯誤響應。默認值為OFF。ON表示發出一跳警告消息,但只有違反了唯一索引的行才會失敗,OFF表示發出錯誤消息,並回滾整個INSERT事物。

STATISRICS_NORECOMPUTE:指定是否重新計算分發統計信息,默認值為OFF。ON表示不會自動重新計算過時的統計信息,OFF表示啟用統計信息自動更新功能。

DROP_EXISTING:指定刪除並重新生成已命名的先前存在的聚集或非聚集索引。默認值為OFF。ON表示刪除並重新生成現有索引。指定的索引名稱必須與當前現有的索引相同,但可以修改索引定義,例如:可以指定不同的列,排序順序,分區方案或索引選項。OFF表示如果指定的索引名已存在,則會顯示一條錯誤。

ONLINE={ON | OFF}:指定在索引操作期間,基礎表和關聯的索引是否用於查詢和數據修改操縱,默認值為OFF。

ALLOW_ROW_LOCKS:指定是否允許行鎖,默認值為ON,ON表示在訪問索引時允許行所。數據庫引擎確定何時使用行鎖。OFF表示未使用行鎖。

ALLOW_PAGE_LOCKS:指定是否允許頁鎖,默認值為ON,ON表示在訪問索引時允許頁鎖。數據庫引擎確定何時使用頁鎖。OFF表示未使用頁鎖。

MAXDOP:指定在索引操作期間,覆蓋【最大並行度】配置選項,使用MAXDOP可以限制在執行並行計划的過程中使用的處理器數量,最大數量為64.

【例1】在teacher表中的t_phone列上,創建一個名稱為Idx_phone的唯一聚集索引,降序排列,填充因子為30%,輸入語句如下:

 CREATE UNIQUE  CLOSTERED INDEX Idx_phone

 ON  teacher (t_phone  DESC)

 WITH

 FILLFACTOR=30;

【例2】 --在teacher表中的t_name和t_gender列上,創建一個名稱為Idx_nameAndgender的-唯一非聚集組合索引,升序排列,填充因子為10%。如下:

--首先創建teacher表

   CREATE TABLE teacher(

     t_id int IDENTITY(1,1) PRIMARY KEY ,

     t_name varchar(20),

     t_phone varchar(11),

     t_gender char(2)

   )

--創建索引

CREATE UNIQUE NONCLUSTERED INDEX Idx_nameAndgender

ON teacher(t_name,t_gender)

WITH

FILLFACTOR=10;

注意:如果teacher表中定義了主鍵,則不能執行【例1】中的腳本,因為每個表只能有一個聚集索引,數據行本身只能按一個順序存儲。並且主鍵本身就是一個聚集索引。

五:管理和維護索引

 索引創建后可以根據需要對數據庫中的索引進行管理,例如在數據表中進行增加,刪除或者更新操作,會使索引頁出現碎塊,為了提高系統的性能,必須對索引進行維護管理,這些管理包括顯示索引信息、索引的性能分析和維護,以及刪除索引等。

1.顯示索引信息

 (1).用系統存儲過程查看索引信息

   系統存儲過程sp_helpindex可以返回某個表或視圖中的索引信息,語法如下:

   sp_helpindex [@objectname= ]  'name';

   [@objectname=] 'name':用戶定義的表或視圖的限定或非限定名稱。僅當指定限定的表或視圖名稱時,才需要使用引號。如果提供了完全限定的名稱,包括數據庫名稱,則該數據庫名稱必須是當前數據庫的名稱。

 【例】使用存儲過程查看是 sample_db數據庫中teacher表中定義的索引信息,輸入語句如下。

  USE  sample_db;

  GO

  exec sp_helpindex 'teacher';

 由執行結果可以看到,這里顯示了authors表中的索引信息:

index_name:指定索引名稱.

index_description:包含索引的描述信息,例如唯一性索引,聚集索引等。

index_keys:包含了索引所在表中的列.

(2).查看索引的統計信息

 索引信息還包括統計信息,這些信息可以用來分析索引性能,更好的維護索引,索引統計信息是查詢優化器用來分析和評估查詢、制定最優查詢方式的基礎數據,用戶可以用圖形界面化工具來查看索引信息,也可以使用DBCC SHOW_STATISTICS命令來查看索引的信息。

【例】使用DBCC SHOW_STATISTICS命令來查看teacher表中Idx_phone索引的統計信息,如下:

  DBCC SHOW_STATISTICS ('sample_db.dbo.teacher',Idx_phone);

  返回的統計信息包括三個部分:統計標題信息,統計密度信息和統計直方信息。統計標題信息主要包括表中的行數,統計抽樣行數,索引列的平均長度等。統計密度信息主要包括索引列前綴集選擇性,平均長度等信息,統計直方圖信息即為顯示直方圖時的信息。

(3).重命名索引

 系統存儲過程sp_rename可以用於更改索引的名稱,其語法如下:

 sp_rename 'object_name','new_name' 'object_type'

object_name:用戶對象或數據類型的當前限定或非限定名稱。此對象可以是表,索引,列,別名數據庫類型或用戶定義類型。

new_name:指定對象的新名稱;

object_type:指定修改的對象類型。下表列出了對象類型的取值:

               sp_rename函數可重命名的對象

 【例】將teacher表中的索引名稱idx_nameAndgender更改為multi_index,輸入如下:

USE  sample_db;

GO

exec sp_rename  'teacher.idx_nameAndgender' ,'multi_index', index;

(4)刪除索引

 當不再需要某個索引時,可以將其刪除,DROP INDEX命令可以刪除一個或者多個當前數據庫中的索引,語法如下:

DROP INDEX '[table | view ].index' [,...n]

或者

DROP INDEX ' index'  ON '[table | view ].index' 

[table | view ]:用於指定索引列所在的表或視圖;

index:用於指定要刪除的索引名稱。

注意:DROP INDEX 命令不能刪除由 CREATE TABLE或者ALTER TABLE命令創建的主鍵(PRIMARY KEY)或者唯一性(UNIQUE)約束索引,也不能刪除系統表重的索引。

【例】刪除表teacher中的索引 multi_index,如下:

USE  sample_db;

GO

exec sp_helpindex 'teacher'

DROP INDEX teacher.multi_index

exec sp_helpindex 'teacher';

LZ在一次面試中遇到的面試題:

1.索引對數據庫性能如此重要,應該如何使用它?

答:為數據庫選擇正確的索引是一項復雜的任務,如果索引較少,則需要的磁盤空間和維護開銷都較少,如果在一個大表上創建了多種組合索引,索引文件會膨脹的很快,而另一方面,索引較多則可覆蓋更多的查詢,可能需要試驗若干不同的設計,才能找到最有效的索引,可以添加、修改和刪除索引而不影響數據庫架構或應用程序設計。因此,應該嘗試多個不同的索引,從而建立最優的索引。

2.為什么要使用短索引?

答:對字符類型的字段進行索引,如果可能應該指定一個前綴長度;例如:如果有一個varchar(255)的列,如果在前10個或者30個字符內,多數值是唯一的,則不需要對整個列進行索引。短索引不僅可以提高查詢速度而且可以節省磁盤空間和減少I/O操作。

 以上例子的整體代碼:

--索引
--創建teacher表
create database sample_db;
CREATE TABLE teacher(
    t_id int IDENTITY(1,1),
    t_name varchar(20),
    t_phone varchar(11),
    t_gender char(2)
)
--【例1】在teacher表中的t_phone列上,創建一個名稱為Idx_phone的唯一聚集索引,
--降序排列,填充因子為30%,輸入語句如下:
CREATE UNIQUE  NONCLUSTERED INDEX Idx_phone
ON  teacher (t_phone  DESC)
WITH
FILLFACTOR=30;
--【例2】在teacher表中的t_name和t_gender列上,創建一個名稱為Idx_nameAndgender的
--唯一非聚集組合索引,升序排列,填充因子為10%。如下:
CREATE UNIQUE NONCLUSTERED INDEX Idx_nameAndgender
ON teacher(t_name,t_gender)
WITH
FILLFACTOR=10;
--用系統存儲過程查看索引信息
USE  sample_db;
GO
exec sp_helpindex 'teacher';
--查看索引統計信息
DBCC SHOW_STATISTICS ('sample_db.dbo.teacher',Idx_phone);
--【例】將teacher表中的索引名稱Idx_nameAndgender更改為multi_index,
--輸入如下:
USE  sample_db;
GO
exec sp_rename  'teacher.Idx_nameAndgender' ,'multi_index', 'index';
--【例】刪除表teacher中的索引 multi_index,如下:
USE  sample_db;
GO
exec sp_helpindex 'teacher'
DROP INDEX teacher.multi_index
exec sp_helpindex 'teacher';

 


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM