近日,一客戶的雲服務器,發現swap使用率達到100% , 正常情況下swap分區使用率都很低或者幾乎為0. 正常情況下,swap 耗盡說明物理內存已耗盡,進而使用大量的swap空間。
而實際上操作系統物理內存仍充足。那么肯定是有什么進程異常占用swap緩存並不釋放。為了找到這個進程,寫了下面一個腳本。記錄在此,以備不時之需:
############################################################################### # Author: halberd.lee@gmail.com # Create: 2020-03-24 ################################################################################ printf "%-20s\t%10s\t%-s\n" "PID" "Swap" "Proc_Name" echo -e '------------------\t------------\t---------------------------' for pid in `ls -l /proc | grep ^d | awk '{ print $9 }'| grep -v [^0-9]|grep -v ^1$` do if [ -f /proc/"$pid"/smaps ]; then swap=$(grep Swap /proc/$pid/smaps | gawk '{ sum+=$2;} END{ print sum }') swap=${swap:=0} # if swap's values is null then set swap=0 fi proc_name=$(ps aux | grep -w "$pid" | grep -v grep | awk '{ for(i=11;i<=NF;i++){ printf("%s ",$i); }}') if [ "$swap" -gt 0 ];then echo -e "$pid\t${swap}\t$proc_name" fi done | sort -k2 -n | gawk -F'\t' '{ pid[NR]=$1; size[NR]=$2; name[NR]=$3; } END{ for(id=1;id<=length(pid);id++) { if(size[id]<1024) printf("%-10s\t%15sKB\t%s\n",pid[id],size[id],name[id]); else if(size[id]<1048576) printf("%-10s\t%15.2fMB\t%s\n",pid[id],size[id]/1024,name[id]); else printf("%-10s\t%15.2fGB\t%s\n",pid[id],size[id]/1048576,name[id]); } }'