MySQL —— 如何快速對比數據？

本文轉載自查看原文 2018-08-16 15:45 2757 mysql數據庫/ 阿里雲rds/ MySQL —— 如何快速對比數據？

我們在MySql中想要對比下兩個不同的實例上的數據並且找出差異，除了主鍵之外我們還要對比每一個字段，應該怎么做呢？

方案一：寫一個程序將兩個實例里面的每一行數據都分別取出來對比，但是耗時我們無法估計，大概天荒地老吧。

方案二：對每一行數據所有字段合並起來，取checksum值，再按照checksum值對比，看着可行，嘗試下。

我們可以先用MySql提供的CONCAT函數來合並字段的值，但是如果CONCAT中含有null值，那么就會導致最終的結果為NULL，所以我們要先用IFNULL函數來替換NULL值，比如：

CONCAT(IFNULL(C1,''),IFNULL(C2,''))

由於加入表有很多行，手動拼接腳本比較累，所以我們可以使用information_schema.COLUMNS來處理：

## 獲取列名的拼接串 SELECT GROUP_CONCAT('IFNULL(',COLUMN_NAME,','''')') FROM information_schema.COLUMNS WHERE TABLE_NAME='table_name';

假設我們有測試表：

CREATE TABLE t_test01 ( id INT AUTO_INCREMENT PRIMARY KEY, C1 INT, C2 INT )

我們便可以拼接出下面的SQL:

SELECT id, MD5(CONCAT( IFNULL(id,''), IFNULL(c1,''), IFNULL(c2,''), )) AS md5_value FROM t_test01

我們在這里執行了之后，把結果使用beyond compare對比下，很容易就能找出不相同的行以及主鍵ID。

但是數據量小一點還行，如果數據量大了，那么執行出來的結果集也是很大的，要想對比就相當費勁，我們就可以嘗試縮小結果集，可以將多行記錄的MD5值合並起來求MD5值，如果最后MD5的值相同，說明這些行也是相同的，如果不同的話肯定是有差異的，我們再對比這些行就可以了。

假設我們按照1000行一組來進行對比，如果需要將分組后的結果合並，需要使用GROUP_CONCAT函數，注意在GROUP_CONCAT函數中添加排序保證合並數據的順序， SQL如下：

SELECT min(id) as min_id, max(id) as max_id, count(1) as row_count, MD5(GROUP_CONCAT( MD5(CONCAT( IFNULL(id,''), IFNULL(c1,''), IFNULL(c2,''), )) ORDER BY id ))AS md5_value FROM t_test01 GROUP BY (id div 1000)

執行結果為：

min_id max_id row_count md5_value 0 999 1000 7d49def23611f610849ef559677fec0c 1000 1999 1000 95d61931aa5d3b48f1e38b3550daee08 2000 2999 1000 b02612548fae8a4455418365b3ae611a 3000 3999 1000 fe798602ab9dd1c69b36a0da568b6dbb

當差異數據較少時，即使需要對比上千萬數據，我們可以輕松根據根據min_id和max_id來快速定位到哪1000條數據里存在差異，再進行逐行MD5值對比，最終找到差異行。

最終對比圖：

免責聲明！

本站轉載的文章為個人學習借鑒使用，本站對版權不負任何法律責任。如果侵犯了您的隱私權益，請聯系本站郵箱yoyou2525@163.com刪除。

猜您在找 MySQL--如何快速對比數據 MySQL 對比數據庫表結構深入對比數據科學工具箱：Python和R之爭各種JS模板引擎對比數據(高性能JavaScript模板引擎) sqlserver 對比數據庫表是否完全一致的簡單方法各種JS模板引擎對比數據(高性能JavaScript模板引擎) 解決springboot從mysql數據庫中取出的時間比數據庫中保存的時間晚8個小時快速還原mysql數據 MySQL如何快速插入數據 springboot2.0+mysql整合mybatis,發現查詢出來的時間比數據庫datetime值快了8小時