UDF的定義
和存儲過程很相似,用戶自定義函數也是一組有序的T-SQL語句,UDF被預先優化和編譯並且尅作為一個單元愛進行調用。UDF和存儲過程的主要區別在於返回結果的方式。
使用UDF時可傳入參數,但不可傳出參數。輸出參數的概念被更為健壯的返回值取代了。和系統函數一樣,可以返回標量值,這個值的好處是它並不像在存儲過程中那樣只限於整形數據類型,而是可以返回大多數SQL Server數據類型。
UDF有以下兩種類型:
- 返回標量值的UDF。
- 返回表的UDF。
創建語法:
CREATE FUNCTION [<schema name>.]<function name> ( [ <@parameter name> [AS] [<schema name>.]<data type> [= <default value> [READONLY]] [,...n] ] ) RETURNS { <scalar type> | TABLE [(<table definition>)] } [ WITH [ENCRYPTION] | [SCHEMABINDING] | [RETURNS NULL ON NULL INPUT | CALLED ON NULL INPUT ] | [EXECUTE AS {CALLER|SELF|OWNER|<'user name'>}] [AS] { EXTERNAL NAME <externam method> | BEGIN [<function statements>] {RETURN <type as defined in RETURNS clause | RETURN (<SELECT statement>)} END}[;]
二、返回標量值的UDF
這種類型的UDF和大多數SQL Server內置函數一樣,會向調用腳本或存儲過程返回標量值,像GETDATE()或USER()函數就會返回標量值。
UDF的返回值並不限於整數,而是可以返回除了BLOB、游標(cursor)和時間戳以外的任何有效的SQL Server數據類型(包括用戶自定義類型)。幾時想返回整數,UDF也有以下兩個吸引人的方面。
與存儲過程不同,用戶自定義函數返回值的目的是提供有意義的數據;而對於存儲過程來說,返回值只能說明成功或失敗,如果失敗,則會提供一些關於失敗性質的特定信息。
可在查詢中內聯執行函數(如作為SELECT語句的一部分),而是用存儲過程則不行。
下面創建一個UDF如下:
CREATE FUNCTION DateOnly(@Date DateTime) RETURNS varchar(12) AS BEGIN RETURN CONVERT(varchar(12),@Date,101) END
然后試着,運用一下:
SELECT * FROM Nx_comment WHERE dbo.DateOnly(com_posttime) = '2012.04.28' --注意前面的dbo是必須的。
其實以上SQL語句相當於:
SELECT * FROM Nx_comment WHERE CONVERT(varchar(12),com_posttime,102) = '2012.04.28'
留意到是用了UDF的SQL語句可讀性更加好。顯示結果如下:

再來看一個簡單的查詢:
SELECT Name,Age, (SELECT AVG(Age) FROM Person) AS AvgAge, Age - (SELECT AVG(Age) FROM Person) AS Difference FROM Person
以上SQL查詢返回結果集如下:

這里要說明一下,列的意思分別是,姓名,年齡,平均年齡以及與平均年齡的差值。
下面我們用UDF來實現,先定義兩個UDF如下:
CREATE FUNCTION dbo.AvgAge() RETURNS int AS BEGIN RETURN (SELECT AVG(Age) FROM Person) END GO CREATE FUNCTION dbo.AgeDifference(@Age int) RETURNS int AS BEGIN RETURN @Age - dbo.AvgAge(); --在一個UDF內引用另外一個UDF,好華麗的說 END
然后執行查詢:
SELECT Name,Age,dbo.AvgAge() AS AvgAge,dbo.AgeDifference(Age) as Difference
FROM Person
以上查詢在返回結果集上與上面單獨的SQL一樣,但是為什么我感覺到速度好像慢了很多呢?知道的哥們回復下。
三、返回表的UDF
SQL Server中的用戶自定義函數並不只限於返回標量值,也可以返回表。返回的表在很大程度上和其他表是一樣的。可以對返回 表的UDF執行JOIN,甚至對結果應用WHERE條件。
改為用表作為返回值並不難,對於UDF來說,表就像任何其他SQL Server數據類型一樣。
為了說明情況,我特地建了一張表如下:

創建一個UDF如下:
CREATE FUNCTION dbo.fnContactName() RETURNS TABLE AS RETURN ( SELECT Id,LastName + ',' + FirstName AS Name FROM Man )
然后我們就可以像表一樣地用UDF了。
SELECT * FROM dbo.fnContactName()
輸出結果如下:

現在再來看看一個簡單的用法,定義UDF如下:
CREATE FUNCTION dbo.fnNameLike(@LName varchar(20)) RETURNS TABLE AS RETURN ( SELECT Id,LastName + ',' + FirstName AS Name FROM Man WHERE LastName Like @LName + '%' )
然后查詢的時候可以這樣用:
SELECT * FROM dbo.fnNameLike('劉')
顯示結果如下:

沒有WHERE子句,沒有過濾SELECT列表,就可以反復使用該函數,而不需要進行"剪切和粘貼"。而且本例做得不好,其實完全可以先連接一次其他表,然后再查詢,這是存儲過程所做不到的。
四、理解確定性
用戶自定義函數可以是確定性的也可以是非確定性的。確定性並不是根據任何參數類型定義的,而是根據函數的功能定義的。如果給定了一組特定的有效輸入,每次函數就都能返回相同的結果,那么就說該函數是確定性的。SUM()就是一個確定性的內置函數。3、5、10的總合永遠都是18,而GETDATE()的值就是非確定性的,因為每次調用它的時候GETDATE()都會改變。
為了達到確定性的要求,函數必須滿足以下4個條件。
- 函數必須是模式綁定的。這意味着函數所依賴的任何對象會有一個依賴記錄,並且在沒有刪除這個依賴的函數之前都不允許改變這些對象。
- 函數引用的所有其他函數,無論是用戶定義的,還是系統定義的,都必須是確定性的。
- 不能引用在函數外部定義的表(可以使用表變量和臨時表,只要它們是在函數作用域內定義就行)。
- 不能使用擴展存儲過程。
確定性的重要性在於它顯示了是否要在視圖或計算列上建立索引。如果可以可靠地確定視圖或計算列的結果,那么才允許在視圖或計算列上建立索引。這意味着,如果視圖或計算列引用非確定性函數,則在該視圖或列上將不允許建立任何索引。
如果判定函數是否是確定性的?除了上面描述的規則外,這些信息存儲在對象的IsDeterministic屬性中,可以利用OBJECTPROPERTY屬性檢查。
SELECT OBJECTPROPERTY(OBJECT_ID('DateOnly'),'IsDeterministic'); --只是剛才的那個自定義函數
輸出結果如下:

居然是非確定性的。原因在於之前在定義該函數的時候,並沒有加上這個"WITH SCHEMABINDING"。
ALTER FUNCTION dbo.DateOnly(@Date date) RETURNS date WITH SCHEMABINDING --當我們加上這一句之后 AS BEGIN RETURN @Date END
在執行查詢,該函數就是確定性的了。

