在SQL Server的性能調優中,有一個不可比面的問題:那就是如何在一段需要長時間的代碼或被頻繁調用的代碼中處理臨時數據集?表變量和臨時表是兩種選擇。記得在給一家國內首屈一指的海運公司作SQL Server應用性能評估和調優的時候就看到過大量的臨時數據集處理需求,而他們的開發人員就無法確定什么時候用臨時表,什么時候用表變量,因此他們就簡單的使用了臨時表。實際上臨時表和表變量都有特定的適用環境。
先賣弄一些基礎的知識:
表變量
變量都以@或@@為前綴,表變量是變量的一種,另外一種變量被稱為標量(可以理解為標准變量,就是標准數據類型的變量,例如整型int或者日期型DateTime)。以@前綴的表變量是本地的,因此只有在當前用戶會話中才可以訪問,而@@前綴的表變量是全局的,通常都是系統變量,比如說@@error代表最近的一個T-SQL語句的報錯號。當然因為表變量首先是個變量,因此它只能在一個Batch中生存,也就是我們所說的邊界,超出了這個邊界,表變量也就消亡了。
表變量存放在內存中,正是因為這一點所有用戶訪問表變量的時候SQL Server是不需要生成日志。同時變量是不需要考慮其他會話訪問的問題,因此也不需要鎖機制,對於非常繁忙的系統來說,避免鎖的使用可以減少一部分系統負載。
表變量另外還有一個限制就是不能創建索引,當然也不存在統計數據的問題,因此在用戶訪問表變量的時候也就不存在執行計划選擇的問題了(也就是以為着編譯階段后就沒有優化階段了),這一特性有的時候是件好事,而有些時候卻會造成一些麻煩。
臨時表
臨時對象都以#或##為前綴,臨時表是臨時對象的一種,還有例如臨時存儲過程、臨時函數之類的臨時對象,臨時對象都存儲在tempdb中。以#前綴的臨時表為本地的,因此只有在當前用戶會話中才可以訪問,而##前綴的臨時表是全局的,因此所有用戶會話都可以訪問。臨時表以會話為邊界,只要創建臨時表的會話沒有結束,臨時表就會持續存在,當然用戶在會話中可以通過DROP TABLE命令提前銷毀臨時表。
我們前面說過臨時表存儲在tempdb中,因此臨時表的訪問是有可能造成物理IO的,當然在修改時也需要生成日志來確保一致性,同時鎖機制也是不可缺少的。
跟表變量另外一個顯著去別就是臨時表可以創建索引,也可以定義統計數據,因此SQL Server在處理訪問臨時表的語句時需要考慮執行計划優化的問題。
表變量 vs. 臨時表
結論
綜上所述,大家會發現臨時表和表變量在底層處理機制上是有很多差別的。
簡單地總結,我們對於較小的臨時計算用數據集推薦使用表變量。如果數據集比較大,如果在代碼中用於臨時計算,同時這種臨時使用永遠都是簡單的全數據集掃描而不需要考慮什么優化,比如說沒有分組或分組很少的聚合(比如說COUNT、SUM、AVERAGE、MAX等),也可以考慮使用表變量。使用表變量另外一個考慮因素是應用環境的內存壓力,如果代碼的運行實例很多,就要特別注意內存變量對內存的消耗。
一般對於大的數據集我們推薦使用臨時表,同時創建索引,或者通過SQL Server的統計數據(Statisitcs)自動創建和維護功能來提供訪問SQL語句的優化。如果需要在多個用戶會話間交換數據,當然臨時表就是唯一的選擇了。需要提及的是,由於臨時表存放在tempdb中,因此要注意tempdb的調優。
SQL中的臨時表和表變量
我們經常使用臨時表和表變量,那現在我們就對臨時表和表變量進行一下討論.
臨時表
局部臨時表
全局臨時表
表變量
臨時表
臨時表存儲在TempDB數據庫中,所有的使用此SQL Server 實例的用戶都共享這個TempDB,因為我們應該確保用來存儲TempDB數據庫的硬盤有足夠的空間,以使之能夠自己的增長.最好能夠存儲在一個擁有獨立硬盤控制器上.因為這樣不存在和其它的硬盤I/O進行爭用.
我們很多程序員認為臨時表非常危險,因為臨時表有可能被多個連接所共享.其實在SQL Server中存在兩種臨時表:局部臨時表和全局臨時表,局部臨時表(Local temp table)以#前綴來標識,並且只能被創建它的連接所使用.全局臨時表(Global temp table)以##前綴來進行標識,並且可以和其它連接所共享.
局部臨時表
局部臨時表不能夠被其它連接所共享的原因其實是在SQL Server 2000中自動為局部臨時表的表名后面加上了一個唯一字符來標識.如:
CREATE TABLE [#DimCustomer_test]
(
[CustomerKey] [int]
, [FirstName] [nvarchar](50)
,[MiddleName] [nvarchar](50)
,[LastName] [nvarchar](50)
)
現在我們來查看一下TempDB中 sysobjects表,我們會發現我們新創建的臨時表#DimCustomer_test已經被加上了后綴:
USE TempDB
GO
SELECT name FROM sysobjects WHERE name LIKE ’%DimCustomer%’
the Result is:
name
#DimCustomer_test___________________________________________________________________________________________________000000000005
全局臨時表
下面我們來看一下全局臨時表:
CREATE TABLE [##DimCustomer_test]
(
[CustomerKey] [int]
, [FirstName] [nvarchar](50)
,[MiddleName] [nvarchar](50)
,[LastName] [nvarchar](50)
)
現在我們來查看一下TempDB中 sysobjects表,我們會發現我們新創建的臨時表##DimCustomer_test沒有被加上了后綴:
USE TempDB
GO
SELECT name FROM sysobjects WHERE name LIKE ’%DimCustomer%’
The Result are:
#DimCustomer_test___________________________________________________________________________________________________000000000005
##DimCustomer_test
--Drop test temp tables
DROP TABLE [##DimCustomer_test]
DROP TABLE [#DimCustomer_test]
可以看到我們剛才創建的全局臨時表名字並沒有被加上標識.
表變量
表變量和臨時表針對我們使用人員來說並沒有什么不同,但是在存儲方面來說,他們是不同的,表變量存儲在內存中.所以在性能上和臨時表相比會更好些!
另一個不同的地方是在表連接中使用表變量時,要為此表變量指定別名.如:
USE AdventureWorksDW
GO
DECLARE @DimCustomer_test TABLE
(
[CustomerKey] [int]
, [FirstName] [nvarchar](50)
,[MiddleName] [nvarchar](50)
,[LastName] [nvarchar](50)
)
---insert data to @DimCustomer_test
INSERT @DimCustomer_test
(
[CustomerKey]
, [FirstName]
,[MiddleName]
,[LastName]
)
SELECT
[CustomerKey]
, [FirstName]
,[MiddleName]
,[LastName]
FROM DimCustomer
SELECT [@DimCustomer_test].CustomerKey,SUM(FactInternetSales.OrderQuantity)
FROM @DimCustomer_test INNER JOIN FactInternetSales ON
@DimCustomer_test.CustomerKey = FactInternetSales.CustomerKey
Group BY CustomerKey
Result:
Server: Msg 137, Level 15, State 2, Line 32
Must declare the variable ’@DimCustomer_test’.
如果我們對上面的查詢進行更改,對查詢使用別名(並且找開IO):
-----in the follow script,we used the table alias.
DECLARE @DimCustomer_test TABLE
(
[CustomerKey] [int]
, [FirstName] [nvarchar](50)
,[MiddleName] [nvarchar](50)
,[LastName] [nvarchar](50)
)
INSERT @DimCustomer_test
(
[CustomerKey]
, [FirstName]
,[MiddleName]
,[LastName]
)
SELECT
[CustomerKey]
, [FirstName]
,[MiddleName]
,[LastName]
FROM DimCustomer
SELECT t.CustomerKey,f.OrderQuantity
FROM @DimCustomer_test t INNER JOIN FactInternetSales f ON
t.CustomerKey = f.CustomerKey
where t.CustomerKey=13513
表變量在批處理結束時自動被系統刪除,所以你不必要像使用臨時表表一樣顯示的對它進行刪除.
----------------------------------------
另外在今天幫同事Tuning SQL 腳本地時候,發現對於大數據量表的查詢(10w-100W),用變量的方式比用select 的方式居然執行時間減少了100倍!!似懂非懂,但從來沒有想到差別如此大,驚訝ing,記錄一筆,研究一下
M1:
declare @tempID int
set @tempID =(select lots_id from qs_notes where id='CVT20080321')
select * from ls_Qs_notes where id = @tempID
---返回記錄998,行執行時間6589
M2:
select * from ls_Qs_notes where id =(select lots_id from qs_notes where id='CVT20080321')
---返回記錄998 ,行執行時間60