線上Java程序占用 CPU 過高,請說一下排查方法?


我是風箏,公眾號「古時的風箏」,一個兼具深度與廣度的程序員鼓勵師,一個本打算寫詩卻寫起了代碼的田園碼農!
文章會收錄在 JavaNewBee 中,更有 Java 后端知識圖譜,從小白到大牛要走的路都在里面。

這個問題可以說是 Java 面試的高頻面試題了,有很多面試官都喜歡問這個問題,問題可能是下面這樣的。

線上一台服務器 CPU 使用率100% 了,如果你碰到這樣的情況,如何排查並找到問題原因?

這就是一個套路題,所謂套路題就是有標准的套路解法的,掌握了套路,不僅能解決面試官,還能解決問題。不然真的就掉進套路里了。

當我們真碰到這個問題的時候應該怎么排查呢?

模擬一個高 CPU 場景

先用一段程序創建幾個線程,將其中一個線程設置成高 CPU 使用率的。

public static void main(String[] args)  {
  for (int i = 0; i < 10; i++) {
    Thread thread = new Thread(() -> {
      System.out.println(Thread.currentThread().getName());
      try {
        Thread.sleep(30 * 60 * 1000);
      }catch (Exception e){
        e.printStackTrace();
      }
    });
    thread.setName("thread-" + i);
    thread.start();
  }

  Thread highCpuThread = new Thread(() -> {
    int i = 0;
    while (true) {
      i++;
    }
  });
  highCpuThread.setName("HighCpu");
  highCpuThread.start();
}

運行這段程序后,前面 10 個線程都處於休眠狀態,只有最后一個線程會持續的占用 CPU 。

運行這段程序,然后就可以開始一些列的操作來發現問題原因了。

排查步驟

第一步,使用 top 找到占用 CPU 最高的 Java 進程

在真實環境中,首先要確認是不是 Java 程序造成的,如果有系統監控工具,可能會直接在預警信息里告訴你是有哪個進程造成的,但也有可能不知道,需要我們手動排查。

如果是在面試場景中,這個問題可能不需要確認,畢竟 Java 面試,面試官可能直接就告訴你是 Java 占用的 CPU 過高。

這一步也非常簡單,就是一個 top命令而已,基本上所有同學都用過這個命令吧。

使用 top命令發現占用 CPU 99.7% 的線程是 Java 進程,進程 PID 為 13731

第二步,用 top -Hp 命令查看占用 CPU 最高的線程

上一步用 top命令找到了那個 Java 進程。那一個進程中有那么多線程,不可能所有線程都一直占着 CPU 不放,這一步要做的就是揪出這個罪魁禍首,當然有可能不止一個。

執行top -Hp pid命令,pid 就是前面的 Java 進程,我這個例子中就是 13731 ,完整命令為:

top -Hp 13731,執行之后的效果如下

可以看到占用 CPU 最高的那個線程 PID 為 13756

然后將 13756轉換為 16 進制的,后面會用到,可以用在線進制轉換的網站直接轉換,轉換結果為 0x35bc

第三步,保存線程棧信息

當前 Java 程序的所有線程信息都可以通過 jstack命令查看,我們用jstack命令將第一步找到的 Java 進程的線程棧保存下來。

jstack 13731 > thread_stack.log

第四步,在線程棧中查找最貴禍首的線程

第二步已經找到了這個罪魁禍首的線程 PID,並把它轉換成了 16 進制的,第三步保存下來的線程棧中有所有線程的 PID 16 進制信息,我們在線程棧中查找這個16進制的線程 id (0x35bc)。

怎么樣,現在一目了然了,線程名稱、線程狀態、以及哪行代碼消耗了最多的 CPU 都很清楚了。


這位英俊瀟灑的少年,如果覺得還不錯的話,給個推薦可好!

公眾號「古時的風箏」,Java 開發者,全棧工程師,bug 殺手,擅長解決問題。
一個兼具深度與廣度的程序員鼓勵師,本打算寫詩卻寫起了代碼的田園碼農!堅持原創干貨輸出,你可選擇現在就關注我,或者看看歷史文章再關注也不遲。長按二維碼關注,跟我一起變優秀!


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM