關系數據庫如何快速查詢表的記錄數

本文轉載自查看原文 2017-05-09 15:58 11360 快速查詢表記錄數/ 數據庫技術(Oracle)

在數據庫中，很多人員習慣使用SELECT COUNT（*）、SELECT COUNT（1)、SELECT COUNT(COL)來查詢一個表有多少記錄，對於小表，這種SQL的開銷倒不是很大，但是對於大表，這種查詢表記錄數的做法就是一個非常消耗資源了，而且效率很差。下面介紹一下SQL Server、 Oracle、MySQL中如何快速獲取表的記錄數。

SQL SERVER 數據庫

在SQL Server數據庫中, 對象目錄視圖sys.partitions中有一個字段rows會記錄表的記錄數。我們以AdventureWorks2014為測試數據庫。

 
          SELECT OBJECT_NAME(object_id)    AS Object_Name,  
           
                 i.name                    AS Index_Name, 
           
                 p.rows                    AS Table_Rows 
           
          FROM sys.partitions  p 
           
          LEFT JOIN sys.sysindexes i ON p.object_id = i.id AND  p.index_id = i.indid   
           
          WHERE 
           
               object_id = OBJECT_ID('TableName')

那么我們還有一些疑問，我們先來看看這些問題吧！

1：沒有索引的表是否也可以使用上面腳本？

2：只有非聚集索引的堆表是否可以使用上面腳本？

3：有多個索引的表，是否記錄數會存在不一致的情況？

4：統計信息不准確的表，是否rows也會不准確

5: 分區表的情況又是怎么樣？

6：對象目錄視圖sys.partitions與sp_spaceused獲取的表記錄函數是否准確。

如下所示，我們先構造測試案例：

 
          IF EXISTS(SELECT 1 FROM sys.objects WHERE type='U' AND name='TEST_TAB_ROW') 
           
          BEGIN 
           
              DROP TABLE TEST_TAB_ROW; 
           
          END 
           
          IF NOT EXISTS(SELECT 1 FROM sys.objects WHERE type='U' AND name='TEST_TAB_ROW') 
           
          BEGIN 
           
                  CREATE TABLE TEST_TAB_ROW 
           
                  ( 
           
                      ID        INT, 
           
                      NAME      CHAR(200) 
           
                  ) 
           
          END 
           
          GO 
           
          SET NOCOUNT ON; 
           
          BEGIN TRAN 
           
          DECLARE @Index INT =1; 
           
          WHILE @Index <= 100000 
           
          BEGIN 
           
              INSERT INTO TEST_TAB_ROW 
           
              VALUES(@Index, NEWID()); 
           
              SET @Index+=1; 
           
              IF (@Index % 5000)  = 0  
           
                 BEGIN 
           
                  IF @@TRANCOUNT > 0  
           
                      BEGIN  
           
                          COMMIT; 
           
                          BEGIN TRAN 
           
                      END 
           
              END 
           
          END 
           
          IF @@TRANCOUNT > 0  
           
          BEGIN  
           
              COMMIT; 
           
          END 
           
          GO

關於問題1、問題2，都可以使用上面腳本，如下測試所示：

 
          SELECT OBJECT_NAME(object_id)    AS Object_Name,  
           
                 i.name                    AS Index_Name, 
           
                 p.rows                    AS Table_Rows 
           
          FROM sys.partitions  p 
           
          LEFT JOIN sys.sysindexes i ON p.object_id = i.id AND  p.index_id = i.indid   
           
          WHERE 
           
               object_id = OBJECT_ID('dbo.TEST_TAB_ROW')

在表dbo.TEST_TAB_ROW 上創建非聚集索引后，查詢結果如下所示：

 
          CREATE INDEX IX_TEST_TAB_ROW ON TEST_TAB_ROW(ID);

我們插入500條記錄，此時，這個數據量不足以觸發統計信息更新，如下所示， Rows Sampled還是1000000

 
          DECLARE @Index INT =1; 
           
          WHILE @Index <= 500 
           
          BEGIN 
           
              INSERT INTO TEST_TAB_ROW 
           
              VALUES(100000 +@Index, NEWID()); 
           
              SET @Index+=1; 
           
          END

如下所示，發現sys.partitions中的記錄變成了100500了，可見rows這個值的計算不依賴統計信息。

當然，如果你用sp_spaceused，發現這里面的記錄也是100500

sp_spaceused 'dbo.TEST_TAB_ROW'

關於問題3：有多個索引的表，是否記錄數會存在不一致的情況？

答案：個人測試以及統計來看，暫時發現多個索引的情況下，sys.partitions中的rows記錄數都是一致的。暫時沒有發現不一致的情況，當然也不排除有特殊情況。

關於問題5: 分區表的情況又是怎么樣？

答案：分區表和普通表沒有任何區別。

關於問題6：對象目錄視圖sys.partitions與sp_spaceused獲取的表記錄函數是否准確？

答案：對象目錄視圖sys.partitions與sp_spaceused獲取的表記錄數是准確的。

ORACLE 數據庫

在ORACLE數據庫中，可以通過DBA_TABLES、ALL_TABLES、USER_TABLES視圖查看表的記錄數，不過這個值（NUM_ROWS）跟統計信息有很大的關系，有時候統計信息沒有更新或采樣比例會導致這個值不是很准確。

 
          SELECT OWNER     ,  
           
                 TABLE_NAME,  
           
                 NUM_ROWS  , 
           
                 LAST_ANALYZED 
           
          FROM   DBA_TABLES  
           
          WHERE  OWNER = '&OWNER'  
           
                 AND TABLE_NAME = '&TABLE_NAME';  
           
          SELECT OWNER, 
           
                TABLE_NAME, 
           
                NUM_ROWS  , 
           
                LAST_ANALYZED 
           
          FROM ALL_TABLES 
           
          WHERE OWNER   ='&OWNER' 
           
          AND TABLE_NAME='&TABLE_NAME'; 
           
          SELECT TABLE_NAME, 
           
                 NUM_ROWS  , 
           
                 LAST_ANALYZED 
           
          FROM USER_TABLES 
           
          WHERE TABLE_NAME='&TABLE_NAME'

更新統計信息后，就能得到准確的行數。所以如果需要得到正確的數據，最好更新目標表的統計信息，進行100%采樣分析。對於分區表，那么就需要從dba_tab_partitions里面查詢相關數據了。

SQL>execute dbms_stats.gather_table_stats(ownname => 'username', tabname =>'tablename', estimate_percent =>100, cascade=>true);

MySQL數據庫

在MySQL中比較特殊，雖然INFORMATION_SCHEMA.TABLES也可以查到表的記錄數，但是非常不准確。如下所示，即使使用ANALYZE TABLE更新了統計信息，從INFORMATION_SCHEMA.TABLES中獲取的記錄依然不准確。

 
          SELECT TABLE_ROWS  
           
          FROM INFORMATION_SCHEMA.TABLES 
           
          WHERE TABLE_NAME='table_name'

 
          mysql> SELECT TABLE_ROWS  
           
              -> FROM INFORMATION_SCHEMA.TABLES 
           
              -> WHERE TABLE_NAME='jiraissue' 
           
              -> ; 
           
          +------------+ 
           
          | TABLE_ROWS | 
           
          +------------+ 
           
          |      36487 | 
           
          +------------+ 
           
          1 row in set (0.01 sec) 
           
          mysql> select count(*) from jiraissue; 
           
          +----------+ 
           
          | count(*) | 
           
          +----------+ 
           
          |    36973 | 
           
          +----------+ 
           
          1 row in set (0.05 sec) 
           
          mysql> analyze table jiraissue; 
           
          +----------------+---------+----------+----------+ 
           
          | Table          | Op      | Msg_type | Msg_text | 
           
          +----------------+---------+----------+----------+ 
           
          | jira.jiraissue | analyze | status   | OK       | 
           
          +----------------+---------+----------+----------+ 
           
          1 row in set (1.41 sec) 
           
          mysql> SELECT TABLE_ROWS  
           
              -> FROM INFORMATION_SCHEMA.TABLES 
           
              -> WHERE TABLE_NAME='jiraissue'; 
           
          +------------+ 
           
          | TABLE_ROWS | 
           
          +------------+ 
           
          |      34193 | 
           
          +------------+ 
           
          1 row in set (0.00 sec) 
           
          mysql>

如上所示，MySQL這種查詢表記錄數的方法看來還是有缺陷的。當然如果不是要求非常精確的值，這個方法也是不錯的。

當然，上面介紹的SQL Server、Oracle、MySQL數據庫中的方法，還是有一些局限性的。例如，只能查詢整張表的記錄數，對於那些查詢記錄數帶有查詢條件（WHERE）這類SQL。還是必須使用SELECT COUNT(*）這種方法。

免責聲明！

本站轉載的文章為個人學習借鑒使用，本站對版權不負任何法律責任。如果侵犯了您的隱私權益，請聯系本站郵箱yoyou2525@163.com刪除。

猜您在找 多對多關系數據庫表 java描述樹形結構與關系數據庫之閉包表第2章關系數據庫關系數據庫原理關系數據庫基本術語 1-1-關系數據庫關系數據庫:定義數據庫表之間的關系關系數據庫與非關系數據庫關系數據庫關系代數 ES數據架構與關系數據庫Mysql