分享一個百萬數量級的測試學習用的mysql數據集


TEST_DB

帶有集成測試套件的示例數據庫,用於測試應用程序和數據庫服務器

此存儲庫已從Launchpad遷移

請參閱MySQL文檔中的用法

它來自哪里

原始數據由西門子企業研究中心的Fusheng Wang和Carlo Zaniolo創建。數據采用XML格式。http://timecenter.cs.aau.dk/software.htm

Giuseppe Maxia制作了關系模式,Patrick Crews以關系格式導出數據。

該數據庫包含大約300,000個員工記錄,其中包含280萬個工資條目。導出數據是167 MB,這不是很大,但是足夠重,不足以進行測試。

生成了數據,因此存在不一致和微妙的問題。我們決定不更改內容,而是將其刪除,並將這些問題用作數據清理練習。

先決條件

您需要一個MySQL數據庫服務器(5.0+)並通過具有以下權限的用戶運行以下命令:

SELECT, INSERT, UPDATE, DELETE, 
CREATE, DROP, RELOAD, REFERENCES, 
INDEX, ALTER, SHOW DATABASES, 
CREATE TEMPORARY TABLES, 
LOCK TABLES, EXECUTE, CREATE VIEW

安裝:

  1. 下載存儲庫
  2. 將目錄更改為存儲庫

然后跑

mysql < employees.sql

如果要使用兩個大型分區表進行安裝,請運行

mysql < employees_partitioned.sql

測試安裝

安裝后,您可以運行以下之一

mysql -t < test_employees_md5.sql
# OR
mysql -t < test_employees_sha.sql

例如:

mysql  -t < test_employees_md5.sql
+----------------------+
| INFO                 |
+----------------------+
| TESTING INSTALLATION |
+----------------------+
+--------------+------------------+----------------------------------+
| table_name   | expected_records | expected_crc                     |
+--------------+------------------+----------------------------------+
| employees    |           300024 | 4ec56ab5ba37218d187cf6ab09ce1aa1 |
| departments  |                9 | d1af5e170d2d1591d776d5638d71fc5f |
| dept_manager |               24 | 8720e2f0853ac9096b689c14664f847e |
| dept_emp     |           331603 | ccf6fe516f990bdaa49713fc478701b7 |
| titles       |           443308 | bfa016c472df68e70a03facafa1bc0a8 |
| salaries     |          2844047 | fd220654e95aea1b169624ffe3fca934 |
+--------------+------------------+----------------------------------+
+--------------+------------------+----------------------------------+
| table_name   | found_records    | found_crc                        |
+--------------+------------------+----------------------------------+
| employees    |           300024 | 4ec56ab5ba37218d187cf6ab09ce1aa1 |
| departments  |                9 | d1af5e170d2d1591d776d5638d71fc5f |
| dept_manager |               24 | 8720e2f0853ac9096b689c14664f847e |
| dept_emp     |           331603 | ccf6fe516f990bdaa49713fc478701b7 |
| titles       |           443308 | bfa016c472df68e70a03facafa1bc0a8 |
| salaries     |          2844047 | fd220654e95aea1b169624ffe3fca934 |
+--------------+------------------+----------------------------------+
+--------------+---------------+-----------+
| table_name   | records_match | crc_match |
+--------------+---------------+-----------+
| employees    | OK            | ok        |
| departments  | OK            | ok        |
| dept_manager | OK            | ok        |
| dept_emp     | OK            | ok        |
| titles       | OK            | ok        |
| salaries     | OK            | ok        |
+--------------+---------------+-----------+

免責聲明

據我所知,這些數據是偽造的,並不符合真實的人。與現有人的任何相似之處純屬巧合。

源地址: https://github.com/datacharmer/test_db


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM