SQL Server UDF用戶自定義函數


UDF的定義

  和存儲過程很相似,用戶自定義函數也是一組有序的T-SQL語句,UDF被預先優化和編譯並且尅作為一個單元愛進行調用。UDF和存儲過程的主要區別在於返回結果的方式。

  使用UDF時可傳入參數,但不可傳出參數。輸出參數的概念被更為健壯的返回值取代了。和系統函數一樣,可以返回標量值,這個值的好處是它並不像在存儲過程中那樣只限於整形數據類型,而是可以返回大多數SQL Server數據類型。

  UDF有以下兩種類型:

  •   返回標量值的UDF。
  •   返回表的UDF。

  創建語法:

CREATE FUNCTION [<schema name>.]<function name>
(
[ <@parameter name> [AS] [<schema name>.]<data type> [= <default value> [READONLY]] [,...n] ]
)
RETURNS { <scalar type> | TABLE [(<table definition>)] }
[ WITH [ENCRYPTION] | [SCHEMABINDING] | [RETURNS NULL ON NULL INPUT | CALLED ON NULL INPUT ] |
[EXECUTE AS {CALLER|SELF|OWNER|<'user name'>}]
[AS] { EXTERNAL NAME <externam method> |
BEGIN
[<function statements>]
{RETURN <type as defined in RETURNS clause | RETURN (<SELECT statement>)}
END}[;]

二、返回標量值的UDF

  這種類型的UDF和大多數SQL Server內置函數一樣,會向調用腳本或存儲過程返回標量值,像GETDATE()或USER()函數就會返回標量值。

  UDF的返回值並不限於整數,而是可以返回除了BLOB、游標(cursor)和時間戳以外的任何有效的SQL Server數據類型(包括用戶自定義類型)。幾時想返回整數,UDF也有以下兩個吸引人的方面。

  與存儲過程不同,用戶自定義函數返回值的目的是提供有意義的數據;而對於存儲過程來說,返回值只能說明成功或失敗,如果失敗,則會提供一些關於失敗性質的特定信息。
可在查詢中內聯執行函數(如作為SELECT語句的一部分),而是用存儲過程則不行。

  下面創建一個UDF如下:

  CREATE FUNCTION DateOnly(@Date DateTime)
  RETURNS varchar(12)
  AS
  BEGIN
      RETURN CONVERT(varchar(12),@Date,101)
  END

  然后試着,運用一下:

  SELECT * FROM Nx_comment 
  WHERE dbo.DateOnly(com_posttime) = '2012.04.28'  --注意前面的dbo是必須的。

  其實以上SQL語句相當於:

  SELECT * FROM Nx_comment 
  WHERE CONVERT(varchar(12),com_posttime,102) = '2012.04.28'

  留意到是用了UDF的SQL語句可讀性更加好。顯示結果如下:

  

  再來看一個簡單的查詢:

  SELECT Name,Age,
      (SELECT AVG(Age) FROM Person) AS AvgAge,
       Age - (SELECT AVG(Age) FROM Person) AS Difference 
  FROM Person

  以上SQL查詢返回結果集如下:

  

  這里要說明一下,列的意思分別是,姓名,年齡,平均年齡以及與平均年齡的差值。

  下面我們用UDF來實現,先定義兩個UDF如下:

  CREATE FUNCTION dbo.AvgAge()
  RETURNS int
  AS
  BEGIN
      RETURN (SELECT AVG(Age) FROM Person)
  END

  GO

  CREATE FUNCTION dbo.AgeDifference(@Age int)
  RETURNS int
  AS
  BEGIN
      RETURN @Age - dbo.AvgAge();        --在一個UDF內引用另外一個UDF,好華麗的說
  END

  然后執行查詢:

  SELECT Name,Age,dbo.AvgAge() AS AvgAge,dbo.AgeDifference(Age) as Difference 
  FROM Person

  以上查詢在返回結果集上與上面單獨的SQL一樣,但是為什么我感覺到速度好像慢了很多呢?知道的哥們回復下。

三、返回表的UDF

  SQL Server中的用戶自定義函數並不只限於返回標量值,也可以返回表。返回的表在很大程度上和其他表是一樣的。可以對返回 表的UDF執行JOIN,甚至對結果應用WHERE條件。

  改為用表作為返回值並不難,對於UDF來說,表就像任何其他SQL Server數據類型一樣。

  為了說明情況,我特地建了一張表如下:

  

  創建一個UDF如下:

  CREATE FUNCTION dbo.fnContactName()
  RETURNS TABLE
  AS
  RETURN (
          SELECT Id,LastName + ',' + FirstName AS Name 
          FROM Man
          )

  然后我們就可以像表一樣地用UDF了。

  SELECT * FROM dbo.fnContactName()

  輸出結果如下:

  

  現在再來看看一個簡單的用法,定義UDF如下:

  CREATE FUNCTION dbo.fnNameLike(@LName varchar(20))
  RETURNS TABLE
  AS
  RETURN (
          SELECT Id,LastName + ',' + FirstName AS Name 
          FROM Man
          WHERE LastName Like @LName + '%'
          )

  然后查詢的時候可以這樣用:

  SELECT * FROM dbo.fnNameLike('')

  顯示結果如下:

  

  沒有WHERE子句,沒有過濾SELECT列表,就可以反復使用該函數,而不需要進行"剪切和粘貼"。而且本例做得不好,其實完全可以先連接一次其他表,然后再查詢,這是存儲過程所做不到的。

四、理解確定性

  用戶自定義函數可以是確定性的也可以是非確定性的。確定性並不是根據任何參數類型定義的,而是根據函數的功能定義的。如果給定了一組特定的有效輸入,每次函數就都能返回相同的結果,那么就說該函數是確定性的。SUM()就是一個確定性的內置函數。3、5、10的總合永遠都是18,而GETDATE()的值就是非確定性的,因為每次調用它的時候GETDATE()都會改變。
  為了達到確定性的要求,函數必須滿足以下4個條件。

  •   函數必須是模式綁定的。這意味着函數所依賴的任何對象會有一個依賴記錄,並且在沒有刪除這個依賴的函數之前都不允許改變這些對象。
  •   函數引用的所有其他函數,無論是用戶定義的,還是系統定義的,都必須是確定性的。
  •   不能引用在函數外部定義的表(可以使用表變量和臨時表,只要它們是在函數作用域內定義就行)。
  •   不能使用擴展存儲過程。

  確定性的重要性在於它顯示了是否要在視圖或計算列上建立索引。如果可以可靠地確定視圖或計算列的結果,那么才允許在視圖或計算列上建立索引。這意味着,如果視圖或計算列引用非確定性函數,則在該視圖或列上將不允許建立任何索引。

  如果判定函數是否是確定性的?除了上面描述的規則外,這些信息存儲在對象的IsDeterministic屬性中,可以利用OBJECTPROPERTY屬性檢查。

  SELECT OBJECTPROPERTY(OBJECT_ID('DateOnly'),'IsDeterministic');  --只是剛才的那個自定義函數

  輸出結果如下:

   

   居然是非確定性的。原因在於之前在定義該函數的時候,並沒有加上這個"WITH SCHEMABINDING"。

  ALTER FUNCTION dbo.DateOnly(@Date date)
  RETURNS date
  WITH SCHEMABINDING  --當我們加上這一句之后
  AS
  BEGIN
    RETURN @Date
  END

  在執行查詢,該函數就是確定性的了。

  

  


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM