分享一個SQLSERVER腳本(計算數據庫中各個表的數據量和每行記錄所占用空間)


分享一個SQLSERVER腳本(計算數據庫中各個表的數據量和每行記錄所占用空間)

很多時候我們都需要計算數據庫中各個表的數據量和每行記錄所占用空間

這里共享一個腳本

CREATE TABLE #tablespaceinfo
    (
      nameinfo VARCHAR(500) ,
      rowsinfo BIGINT ,
      reserved VARCHAR(20) ,
      datainfo VARCHAR(20) ,
      index_size VARCHAR(20) ,
      unused VARCHAR(20)
    )  
 
DECLARE @tablename VARCHAR(255);  
 
DECLARE Info_cursor CURSOR
FOR
    SELECT  '[' + [name] + ']'
    FROM    sys.tables
    WHERE   type = 'U';  
 
OPEN Info_cursor  
FETCH NEXT FROM Info_cursor INTO @tablename  
 
WHILE @@FETCH_STATUS = 0
    BEGIN 
        INSERT  INTO #tablespaceinfo
                EXEC sp_spaceused @tablename  
        FETCH NEXT FROM Info_cursor  
    INTO @tablename  
    END 
 
CLOSE Info_cursor  
DEALLOCATE Info_cursor  
 
--創建臨時表
CREATE TABLE [#tmptb]
    (
      TableName VARCHAR(50) ,
      DataInfo BIGINT ,
      RowsInfo BIGINT ,
      Spaceperrow AS ( CASE RowsInfo
                         WHEN 0 THEN 0
                         ELSE DataInfo / RowsInfo
                       END ) PERSISTED
    )

--插入數據到臨時表
INSERT  INTO [#tmptb]
        ( [TableName] ,
          [DataInfo] ,
          [RowsInfo]
        )
        SELECT  [nameinfo] ,
                CAST(REPLACE([datainfo], 'KB', '') AS BIGINT) AS 'datainfo' ,
                [rowsinfo]
        FROM    #tablespaceinfo
        ORDER BY CAST(REPLACE(reserved, 'KB', '') AS INT) DESC  


--匯總記錄
SELECT  [tbspinfo].* ,
        [tmptb].[Spaceperrow] AS '每行記錄大概占用空間(KB)'
FROM    [#tablespaceinfo] AS tbspinfo ,
        [#tmptb] AS tmptb
WHERE   [tbspinfo].[nameinfo] = [tmptb].[TableName]
ORDER BY CAST(REPLACE([tbspinfo].[reserved], 'KB', '') AS INT) DESC  

DROP TABLE [#tablespaceinfo]
DROP TABLE [#tmptb]

注意:使用之前要計算哪個數據庫的記錄,請先USE一下要統計表記錄數的那個數據庫!!

 


工作中遇到的問題

可以說我在實際的工作中 ,在100個問題中有90個都會先用到這個腳本

這里舉一個我本人工作中遇到的一些問題

 

問題一:

程序員反映數據庫查詢慢,5分鍾還沒有出結果

我先用這個腳本看一下這個表有多少記錄,大概有1000w+條數據

然后在本地的SSMS里查詢,確實也是大概4分鍾的樣子才出來數據,看一下執行計划,發現查詢能使用到索引

看一下數據庫的壓力,並不是很大,我跟會不會跟數據量有關系呢?

程序員要查詢的結果條數是500條數據,業務表是做了分區的,按道理應該不會慢成這樣。。。

后來我再看一下共享出來的那個腳本的結果,發現查詢的結果大小=每行記錄的大小*記錄數

要查詢大概500MB的數據,再傳到客戶端,不慢才怪

 

為什麽查詢出的結果這么大?

主要是有幾個大字段:例如:二進制字段和NVARCHAR(MAX)

並且時間范圍跨度比較大

 

馬上叫程序員改一下查詢的語句,由於是entity framework程序,怎麽改我就不太清楚了,主要是不必要的字段就不查詢處理並且縮小時間范圍

 

問題二:

還有一些問題也需要知道每行記錄的大小,例如刪除表的歷史數據,QA說要保留2013年之前的數據,你需要查出保留的數據或者2013年之前的數據占用多少G空間

再結合當前服務器的磁盤可用空間,來評估刪除的數據是否太多或者太少

那么流程是:先查出2013年之前的記錄數有多少-》計算表的總記錄數-》計算表的大小-》手工計算每行記錄的大小-》乘以2013年之前的記錄數

如果沒有每行記錄數這個字段,那么你手工計算,是不是效率就變慢了???

 

問題三:

導數據的時候,你想知道當前已經導了多少數據了,那么執行一下這個腳本就可以了,這個腳本基本不會被阻塞

很快就能查出結果


腳本的計算方法

方法一

實際上利用的就是數據行大小的信息除以記錄數

CASE RowsInfo
WHEN 0 THEN 0
ELSE DataInfo / RowsInfo

 

 

 方法二

SELECT AVG(DATALENGTH(C0))+AVG(DATALENGTH(C1))+AVG(DATALENGTH(C2))+AVG(DATALENGTH(C3)) FROM [dbo].[TB106]

 

說一下兩種方法的區別

第一種方法是效率高,當表有上億條記錄的時候,如果你使用第二種方法執行AVG(DATALENGTH(C0))是很慢的,因為SQLSERVER要統計字段大小信息

可能十幾分鍾都出不來結果

 

當然,第一種方法也有一些缺陷,就是當表的記錄數少的時候,統計出來的每行記錄占用空間是不准確的

因為datainfo這個值是以數據頁大小為單位的,因為就算表只有一條記錄,那么也會占用一個數據頁(8KB)

那么當8KB/1 =8KB,一條記錄肯定不會是8KB大小的,所以記錄少的時候會不准確

但是當記錄數很多的時候,就准確了

 

看一下TB106這個表統計出來的結果值

SELECT AVG(DATALENGTH(C0))+AVG(DATALENGTH(C1))+AVG(DATALENGTH(C2))+AVG(DATALENGTH(C3)) FROM [dbo].[TB106]

可以看到是比較准確的

 

注意:

無論方法一還是方法二都不包括索引所占用的空間 !!


總結

大家平時一定會想:究竟DBA有什么作用?

在這里就給大家一個例子了,在工作中,程序員是不會關心他要查詢的數據的大小的,他不管三七二十一只要把數據select出來就行了,然后收工

DBA這里就要解決數據查詢不出來的問題,一般的程序員覺得查詢500條數據是很少的,根本不會關心表設計,表的字段的數據類型

當工作越來越多,開發任務越來越重的時候更是這樣



 
所以本人覺得DBA這個角色還是比較重要的o(∩_∩)o 
 
如有不對的地方,歡迎大家拍磚o(∩_∩)o 
 
 
2014-7-7 腳本bug修復
由於算出來每行記錄的精度有問題,我又對腳本的精度進行了改進
CREATE TABLE #tablespaceinfo
    (
      nameinfo VARCHAR(500) ,
      rowsinfo BIGINT ,
      reserved VARCHAR(20) ,
      datainfo VARCHAR(20) ,
      index_size VARCHAR(20) ,
      unused VARCHAR(20)
    )  
 
DECLARE @tablename VARCHAR(255);  
 
DECLARE Info_cursor CURSOR
FOR
    SELECT  '[' + [name] + ']'
    FROM    sys.tables
    WHERE   type = 'U';  
 
OPEN Info_cursor  
FETCH NEXT FROM Info_cursor INTO @tablename  
 
WHILE @@FETCH_STATUS = 0
    BEGIN 
        INSERT  INTO #tablespaceinfo
                EXEC sp_spaceused @tablename  
        FETCH NEXT FROM Info_cursor  
    INTO @tablename  
    END 
 
CLOSE Info_cursor  
DEALLOCATE Info_cursor  
 
--創建臨時表
CREATE TABLE [#tmptb]
    (
      TableName VARCHAR(50) ,
      DataInfo BIGINT ,
      RowsInfo BIGINT ,
      Spaceperrow  AS ( CASE RowsInfo
                         WHEN 0 THEN 0
                         ELSE CAST(DataInfo AS decimal(18,2))/CAST(RowsInfo AS decimal(18,2))
                       END ) PERSISTED
    )

--插入數據到臨時表
INSERT  INTO [#tmptb]
        ( [TableName] ,
          [DataInfo] ,
          [RowsInfo]
        )
        SELECT  [nameinfo] ,
                CAST(REPLACE([datainfo], 'KB', '') AS BIGINT) AS 'datainfo' ,
                [rowsinfo]
        FROM    #tablespaceinfo
        ORDER BY CAST(REPLACE(reserved, 'KB', '') AS INT) DESC  


--匯總記錄
SELECT  [tbspinfo].* ,
        [tmptb].[Spaceperrow] AS '每行記錄大概占用空間(KB)'
FROM    [#tablespaceinfo] AS tbspinfo ,
        [#tmptb] AS tmptb
WHERE   [tbspinfo].[nameinfo] = [tmptb].[TableName]
ORDER BY CAST(REPLACE([tbspinfo].[reserved], 'KB', '') AS INT) DESC  

DROP TABLE [#tablespaceinfo]
DROP TABLE [#tmptb]

 

適合於不是默認架構dba的版本

--數據分析適合不是默認架構dbo
--在它的基礎上做了些修改,適合不同的框架
IF OBJECT_ID('tempdb..#TablesSizes') IS NOT NULL
    DROP TABLE #TablesSizes

CREATE TABLE #TablesSizes
    (
      TableName sysname ,
      Rows BIGINT ,
      reserved VARCHAR(100) ,
      data VARCHAR(100) ,
      index_size VARCHAR(100) ,
      unused VARCHAR(100)
    )

DECLARE @sql VARCHAR(MAX)
SELECT  @sql = COALESCE(@sql, '') + '
INSERT INTO #TablesSizes execute sp_spaceused ''' + QUOTENAME(TABLE_SCHEMA,
                                                              '[]') + '.'
        + QUOTENAME(Table_Name, '[]') + ''''
FROM    INFORMATION_SCHEMA.TABLES
WHERE   TABLE_TYPE = 'BASE TABLE'

PRINT ( @SQL )
EXECUTE (@SQL)

SELECT  *
FROM    #TablesSizes
ORDER BY Rows DESC 

 

MySQL版本

--查看每個表大小和記錄數
SELECT table_name,TABLE_ROWS,ENGINE, CONCAT(ROUND(DATA_LENGTH/1024/1024,2),'MB') AS DATA_LENGTH,
CONCAT(ROUND(INDEX_LENGTH/1024/1024,2),'MB') AS INDEX_LENGTH,
CONCAT(ROUND((INDEX_LENGTH+DATA_LENGTH)/1024/1024,2),'MB') AS TOTAL_DATASIZE
FROM information_schema.TABLES WHERE table_schema='zabbix'  ORDER BY TOTAL_DATASIZE DESC

 

 

本文版權歸作者所有,未經作者同意不得轉載。


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM