你向 Mysql 數據庫插入 100w 條數據用了多久?


閱讀本文大概需要 2 分鍾。

▌目錄

多線程插入(單表)

多線程插入(多表)

預處理 SQL

多值插入 SQL

事務( N 條提交一次)

▌多線程插入(單表)

問:為何對同一個表的插入多線程會比單線程快?同一時間對一個表的寫操作不應該是獨占的嗎?

答:在數據里做插入操作的時候,整體時間的分配是這樣的:

  • 鏈接耗時 (30%)

  • 發送 query 到服務器 (20%)

  • 解析 query (20%)

  • 插入操作 (10% * 詞條數目)

  • 插入 index (10% * Index的數目)

  • 關閉鏈接 (10%)

從這里可以看出來,真正耗時的不是操作,而是鏈接,解析的過程。

MySQL 插入數據在寫階段是獨占的,但是插入一條數據仍然需要解析、計算、最后才進行寫處理,比如要給每一條記錄分配自增 id,校驗主鍵唯一鍵屬性,或者其他一些邏輯處理,都是需要計算的,所以說多線程能夠提高效率。

▌多線程插入(多表)

分區分表后使用多線程插入。

▌預處理 SQL

  • 普通 SQL,即使用 Statement 接口執行 SQL

  • 預處理 SQL,即使用 PreparedStatement 接口執行 SQL

使用 PreparedStatement 接口允許數據庫預編譯 SQL 語句,以后只需傳入參數,避免了數據庫每次都編譯 SQL 語句,因此性能更好。

String sql = "insert into testdb.tuser (name, remark, createtime, updatetime) values (?, ?, ?, ?)"; for (int i = 0; i < m; i++) {     //從池中獲取連接     Connection conn = myBroker.getConnection();     PreparedStatement pstmt = conn.prepareStatement(sql);     for (int k = 0; k < n; k++) {             pstmt.setString(1, RandomToolkit.generateString(12));             pstmt.setString(2, RandomToolkit.generateString(24));             pstmt.setDate(3, new Date(System.currentTimeMillis()));             pstmt.setDate(4, new Date(System.currentTimeMillis()));             //加入批處理             pstmt.addBatch();     }     pstmt.executeBatch();    //執行批處理     pstmt.close();     myBroker.freeConnection(conn); //連接歸池 }

 

▌多值插入 SQL

  • 普通插入 SQL:INSERT INTO TBL_TEST (id) VALUES(1)

  • 多值插入 SQL:INSERT INTO TBL_TEST (id) VALUES (1), (2), (3)

使用多值插入 SQL,SQL 語句的總長度減少,即減少了網絡 IO,同時也降低了連接次數,數據庫一次 SQL 解析,能夠插入多條數據。

▌事務( N 條提交一次)

在一個事務中提交大量 INSERT 語句可以提高性能。

1、將表的存儲引擎修改為 myisam

2、將 sql 拼接成字符串,每 1000 條左右提交事務。

/// <summary>          /// 執行多條SQL語句,實現數據庫事務。          /// </summary>mysql數據庫          /// <param name="SQLStringList">多條SQL語句</param>          public void ExecuteSqlTran(List<string> SQLStringList)        {            using (MySqlConnection conn = new MySqlConnection(connectionString))            {                if (DBVariable.flag)                {                    conn.Open();                    MySqlCommand cmd = new MySqlCommand();                    cmd.Connection = conn;                    MySqlTransaction tx = conn.BeginTransaction();                    cmd.Transaction = tx;                    try                    {                        for (int n = 0; n < SQLStringList.Count; n++)                        {                            string strsql = SQLStringList[n].ToString();                            if (strsql.Trim().Length > 1)                            {                                cmd.CommandText = strsql;                                cmd.ExecuteNonQuery();                            }                            //后來加上的                              if (n > 0 && (n % 1000 == 0 || n == SQLStringList.Count - 1))                            {                                tx.Commit();                                tx = conn.BeginTransaction();                            }                        }                        //tx.Commit();//原來一次性提交                      }                    catch (System.Data.SqlClient.SqlException E)                    {                        tx.Rollback();                        throw new Exception(E.Message);                    }                }            }        }

10w 條數據大概用時 10s!

 

 

·END·

程序員的成長之路

路雖遠,行則必至

本文原發於 同名微信公眾號「程序員的成長之路」,回復「1024」你懂得,給個贊唄。

回復 [ 520 ] 領取程序員最佳學習方式

回復 [ 256 ] 查看 Java 程序員成長規划

 


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM