Linux CPU占用率過高時問題排查


https://blog.csdn.net/yunzhonghefei/article/details/89207243

 

1.查看CPU占用率高的進程
    1.1> top
    1.2> 用ps -eo pid,pcpu | sort -n -k 2 
    
2.確定高cpu消耗的線程
    2.1>top -H
    2.2>ps H -eo pid,tid,pcpu | sort -n -k 3
    
3.查看進程的線程
    3.1>pstree -p pid
    3.2>查看線程的相信信息:cat /proc/進程號/task/線程號/status
    
4.實時線程進程的資源占用信息
    4.1>top -H -p pid
    
5.查看該進程下的所有線程
    5.1>ps -efL | grep pid
    5.2>根據pid,查找占用cpu較高的線程
        ps -mp pid -o THREAD,tid,time
6.使用jstack定位線程堆棧信息,精確找到異常代碼
    6.1>查看某進程下占用CPU較高的線程:ps p 替換進程號 -L -o pcpu,pid,tid,time,tname,cmd
        

%CPU   PID   TID     TIME TTY      CMD
         0.0  1538  1538 00:00:00 ?        java -classpath .:/usr/java/jdk1.8.0_131/lib/dt.jar:/usr/java/jdk1.8.0_131/lib/tools.jar:lib/adsl.jar:lib/commons-beanutils-1.8
        97.1  1538  1539 04:39:56 ?        java -classpath .:/usr/java/jdk1.8.0_131/lib/dt.jar:/usr/java/jdk1.8.0_131/lib/tools.jar:lib/adsl.jar:lib/commons-beanutils-1.8
         0.1  1538  1540 00:00:25 ?        java -classpath .:/usr/java/jdk1.8.0_131/lib/dt.jar:/usr/java/jdk1.8.0_131/lib/tools.jar:lib/adsl.jar:lib/commons-beanutils-1.8
         0.0  1538  1541 00:00:00 ?        java -classpath .:/usr/java/jdk1.8.0_131/lib/dt.jar:/usr/java/jdk1.8.0_131/lib/tools.jar:lib/adsl.jar:lib/commons-beanutils-1.8
         0.0  1538  1542 00:00:00 ?        java -classpath .:/usr/java/jdk1.8.0_131/lib/dt.jar:/usr/java/jdk1.8.0_131/lib/tools.jar:lib/adsl.jar:lib/commons-beanutils-1.8
         0.0  1538  1543 00:00:00 ?        java -classpath .:/usr/java/jdk1.8.0_131/lib/dt.jar:/usr/java/jdk1.8.0_131/lib/tools.jar:lib/adsl.jar:lib/commons-beanutils-1.8
         0.1  1538  1544 00:00:33 ?        java -classpath .:/usr/java/jdk1.8.0_131/lib/dt.jar:/usr/java/jdk1.8.0_131/lib/tools.jar:lib/adsl.jar:lib/commons-beanutils-1.8
         0.0  1538  1545 00:00:12 ?        java -classpath .:/usr/java/jdk1.8.0_131/lib/dt.jar:/usr/java/jdk1.8.0_131/lib/tools.jar:lib/adsl.jar:lib/commons-beanutils-1.8
         0.0  1538  1546 00:00:00 ?        java -classpath .:/usr/java/jdk1.8.0_131/lib/dt.jar:/usr/java/jdk1.8.0_131/lib/tools.jar:lib/adsl.jar:lib/commons-beanutils-1.8
         0.5  1538  1547 00:01:43 ?        java -classpath .:/usr/java/jdk1.8.0_131/lib/dt.jar:/usr/java/jdk1.8.0_131/lib/tools.jar:lib/adsl.jar:lib/commons-beanutils-1.8
         0.0  1538  7170 00:00:00 ?        java -classpath .:/usr/java/jdk1.8.0_131/lib/dt.jar:/usr/java/jdk1.8.0_131/lib/tools.jar:lib/adsl.jar:lib/commons-beanutils-1.8

    6.2>將獲取的線程號(十進制數)轉換成十六進制
        printf "%x\n" 1539
        結果:603
    6.3>結合進程號和線程號,利用jstack查到異常代碼所在行
        jstack -l 1538| grep 0x603 -A 10
        結果:
        

[root@cloud ~]# jstack -l 1538| grep 0x603 -A 10
        "main" #1 prio=5 os_prio=0 tid=0x00007f0088008800 nid=0x603 runnable [0x00007f008ca04000]
           java.lang.Thread.State: RUNNABLE
            at com.xxxx.xxxx.tester.Pppoe.main(Unknown Source)

           Locked ownable synchronizers:
            - None

        "VM Thread" os_prio=0 tid=0x00007f008806d000 nid=0x604 runnable         "VM Periodic Task Thread" os_prio=0 tid=0x00007f00880c0000 nid=0x60b waiting on condition
    此時,就可以看到占用CPU的程序了。
        
    6.4>將信息輸出到文件
        jstack -l 1538 > 1538.pid
        使用vi查看。
        
    6.5>注意:需要在多個時間段提出多個 Thread Dump信息,然后綜合進行對比分析,單獨分析一個文件是沒有意義的
    
        
    腳本(cpu飆高時):
    

#!/bin/bash
    #
    # 當JVM占用CPU特別高時,查看CPU正在做什么
    # 可輸入兩個參數:1、pid Java進程ID,必須參數  2、打印線程ID上下文行數,可選參數,默認打印10行
    #

    pid=$1

    if test -z $pid
    then
     echo "pid can not be null!"
     exit
    else
     echo "checking pid($pid)"
    fi

    if test -z "$(jps -l | cut -d '' -f 1 | grep $pid)"
    then
     echo "process of $pid is not exists"
     exit
    fi

    lineNum=$2
    if test -z $lineNum
    then
        $lineNum=10
    fi

    jstack $pid >> "$pid".bak

    ps -mp $pid -o THREAD,tid,time | sort -k2r | awk '{if ($1 !="USER" && $2 != "0.0" && $8 !="-") print $8;}' | xargs printf "%x\n" >> "$pid".tmp

    tidArray="$( cat $pid.tmp)"

    for tid in $tidArray
    do
        echo "******************************************************************* ThreadId=$tid **************************************************************************"
        cat "$pid".bak | grep $tid -A $lineNum
    done

    rm -rf $pid.bak
    rm -rf $pid.tmp
    
參考:https://www.jianshu.com/p/90579ec3113f
————————————————
版權聲明:本文為CSDN博主「yunzhonghefei」的原創文章,遵循CC 4.0 BY-SA版權協議,轉載請附上原文出處鏈接及本聲明。
原文鏈接:https://blog.csdn.net/yunzhonghefei/article/details/89207243


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM