在使用Mysql的mysqldump命令按時間進行數據導出時,我們可能會遇到導出數據與原庫中不符或者導出數據和我們期望的數據不同的情況。
我們知道Mysql數據庫導出可以使用命令mysqldump,使用方式可以通過在終端中輸入mysqldump --help來查看。
簡單的使用方式如下:
1. 導出整個數據庫(包括數據庫中的數據)
mysqldump -u username -p dbname > dbname.sql
2. 導出數據庫結構(不含數據)
mysqldump -u username -p -d dbname > dbname.sql
3. 導出數據庫中的某張數據表(包含數據)
mysqldump -u username -p dbname tablename > tablename.sql
4. 導出數據庫中的某張數據表的表結構(不含數據)
mysqldump -u username -p -d dbname tablename > tablename.sql
我們可以用-w(或-where)指定備份條件。在使用過程中遇到一個問題,按時間導出時,導出的數據時“丟失”了一部分數據,並且時間與庫中的不同。
例如我們有下面這個表:
CREATE TABLE `test_timestamp` ( `pk` int(20) unsigned NOT NULL AUTO_INCREMENT, `record_time` timestamp NULL DEFAULT NULL COMMENT '記錄日期', PRIMARY KEY (`pk`), KEY `time` (`record_time`) ) ENGINE=MyISAM AUTO_INCREMENT=564374307 DEFAULT CHARSET=utf8; INSERT INTO `test_timestamp` VALUES (1,'2016-08-04 16:00:00'),(2,'2016-08-04 20:00:00'),(3,'2016-08-05 00:00:00'),(4,'2016-08-05 04:00:00');
其中record_time為timestamp類型,在數據庫中查詢為:
mysql> SELECT * FROM iptv.test_timestamp; +----+-----------------------------+ | pk | record_time | +----+-----------------------------+ | 1 | 2016-08-05 00:00:00 | | 2 | 2016-08-05 04:00:00 | | 3 | 2016-08-05 08:00:00 | | 4 | 2016-08-05 12:00:00 | +----+-----------------------------+
我們將時間大於等於2016-08-05 00:00:00的數據導出:
mysqldump -u root -p iptv test_timestamp -w"record_time >= '2016-08-05 00:00:00' " > /home/test.sql
然后將其導入到原來的庫中后再查詢:
mysql> SELECT * FROM iptv.test_timestamp; +----+-----------------------------+ | pk | record_time | +----+-----------------------------+ | 3 | 2016-08-05 08:00:00 | | 4 | 2016-08-05 12:00:00 | +----+-----------------------------+ 2 rows in set (0.00 sec)
發現只有兩條數據。此時,如果我們查看導出的test.sql文件,發現里面只有兩條記錄:
(3,'2016-08-05 00:00:00'),
(4,'2016-08-05 04:00:00')
這與以前庫中的記錄相差8個小時。
原因就是在導出時,如果沒有加其他選項,在我們的導出文件中有這樣幾行:
….
/*!40103 SET @OLD_TIME_ZONE=@@TIME_ZONE */;
/*!40103 SET TIME_ZONE='+00:00' */;
….
也就是說,在導出時,首先會將時區time_zone設置為'+00:00',而time_zone這個值在數據庫中默認是什么呢:
mysql> show variables like '%time_zone%'; +--------------------------+------------+ | Variable_name | Value | +--------------------------+------------+ | system_time_zone | CST | | time_zone | SYSTEM | +--------------------------+------------+ 2 rows in set (0.00 sec)
是系統默認時區,查看系統默認時區:
[root@hadoop-data-1 /]# date -R Thu, 25 Aug 2016 16:25:06 +0800
所有我們的在導出數據時,時間會先做轉換,然后再進行查詢,轉換后的記錄為:
(1,'2016-08-04 16:00:00'),
(2,'2016-08-04 20:00:00'),
(3,'2016-08-05 00:00:00'),
(4,'2016-08-05 04:00:00');
按照 -w"record_time >= '2016-08-05 00:00:00' "過濾后只剩下:
(3,'2016-08-05 00:00:00'),
(4,'2016-08-05 04:00:00');
所以插入后只剩下兩條數據了。
我們在按時間導出數據時需要注意這個問題。解決的方式一種是在-w參數中將時間自己進行轉換,另外一種方式是先將需要導出的庫的時區進行設置
set time_zone='+00:00';
導出結束后再恢復:
set time_zone='SYSTEM';
同時,如果導出和導入的庫所使用 的時區不同,那么導入的只是時間顯示就不一樣,如果把兩個庫時區設置為一樣,數值顯示就相同了。所有當同樣的數據在不同數據庫中顯示不同時,需要先確認一下時區的問題。