大數據量查詢容易OOM?試試MySQL流式查詢


mark

一、前言

程序訪問 MySQL 數據庫時,當查詢出來的數據量特別大時,數據庫驅動把加載到的數據全部加載到內存里,就有可能會導致內存溢出(OOM)。

其實在 MySQL 數據庫中提供了流式查詢,允許把符合條件的數據分批一部分一部分地加載到內存中,可以有效避免OOM;本文主要介紹如何使用流式查詢並對比普通查詢進行性能測試。

 

二、JDBC實現流式查詢

使用JDBC的 PreparedStatement/StatementsetFetchSize 方法設置為 Integer.MIN_VALUE 或者使用方法 Statement.enableStreamingResults() 可以實現流式查詢,在執行 ResultSet.next() 方法時,會通過數據庫連接一條一條的返回,這樣也不會大量占用客戶端的內存。

public int execute(String sql, boolean isStreamQuery) throws SQLException {
    Connection conn = null;
    PreparedStatement stmt = null;
    ResultSet rs = null;
    int count = 0;
    try {
        //獲取數據庫連接
        conn = getConnection();
        if (isStreamQuery) {
            //設置流式查詢參數
            stmt = conn.prepareStatement(sql, ResultSet.TYPE_FORWARD_ONLY, ResultSet.CONCUR_READ_ONLY);
            stmt.setFetchSize(Integer.MIN_VALUE);
        } else {
            //普通查詢
            stmt = conn.prepareStatement(sql);
        }

        //執行查詢獲取結果
        rs = stmt.executeQuery();
        //遍歷結果
        while(rs.next()){
            System.out.println(rs.getString(1));
            count++;
        }
    } catch (SQLException e) {
        e.printStackTrace();
    } finally {
        close(stmt, rs, conn);
    }
    return count;
}

PS:上面的例子中通過參數 isStreamQuery 來切換流式查詢普通查詢,用於下面做測試對比。

 

三、性能測試

創建了一張測試表 my_test 進行測試,總數據量為 27w 條,分別使用以下4個測試用例進行測試:

  1. 大數據量普通查詢(27w條)
  2. 大數據量流式查詢(27w條)
  3. 小數據量普通查詢(10條)
  4. 小數據量流式查詢(10條)

 

3.1. 測試大數據量普通查詢

@Test
public void testCommonBigData() throws SQLException {
    String sql = "select * from my_test";
    testExecute(sql, false);
}

3.1.1. 查詢耗時

27w 數據量用時 38 秒
file

3.1.2. 內存占用情況

使用將近 1G 內存

 

3.2. 測試大數據量流式查詢

@Test
public void testStreamBigData() throws SQLException {
    String sql = "select * from my_test";
    testExecute(sql, true);
}

3.2.1. 查詢耗時

27w 數據量用時 37 秒

3.2.2. 內存占用情況

由於是分批獲取,所以內存在30-270m波動

 

3.3. 測試小數據量普通查詢

@Test
public void testCommonSmallData() throws SQLException {
    String sql = "select * from my_test limit 100000, 10";
    testExecute(sql, false);
}

3.3.1. 查詢耗時

10 條數據量用時 1 秒

 

3.4. 測試小數據量流式查詢

@Test
public void testStreamSmallData() throws SQLException {
    String sql = "select * from my_test limit 100000, 10";
    testExecute(sql, true);
}

3.4.1. 查詢耗時

10 條數據量用時 1 秒

 

四、總結

MySQL 流式查詢對於內存占用方面的優化還是比較明顯的,但是對於查詢速度的影響較小,主要用於解決大數據量查詢時的內存占用多的場景。

DEMO地址https://github.com/zlt2000/mysql-stream-query

 

掃碼關注有驚喜!

file


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM