今天一大早來到公司就發現一台遠程服務器的進程滿了,無法連接上遠程服務器,如下圖所示:
出現這種情況,主要是因為進程跑滿了,memory被消耗光了,無法為其他的操作,包括vnc操作命令和SSH連接分配內存,我們可以用兩個辦法:
1、init 6(重啟服務器,注意,不是重啟tomcat)
大家都知道,死機了就重啟開機嘛,要是不行init 6 不行在使用reboot強制重啟(可能需要多敲幾次)
第一種比較粗暴,通常情況下我們選擇第二種:
2、
free:通過free命令查看內存剩余可用情況(這個命令可能需要多敲幾遍)
命令可帶參數:
-b 以Byte為單位顯示內存使用情況。
-k 以KB為單位顯示內存使用情況。
-m 以MB為單位顯示內存使用情況。
-g 以GB為單位顯示內存使用情況。
-o 不顯示緩沖區調節列。
-s<間隔秒數> 持續觀察內存使用狀況。
-t 顯示內存總和列。
-V 顯示版本信息。
頁面顯示參數解釋:
total:總計物理內存的大小。
used:已使用多大。
free:可用有多少。
Shared:多個進程共享的內存總額。
Buffers/cached:磁盤緩存的大小
Swap:交換分區(虛擬內存)情況;Mem:實際內存的使用情況
sysctl kernel.pid_max:查看最大進程數
主要是查看pid_max指標的,pid_max是Linux內核用來限制進程數的一個最大指標,換言之,即最大允許進程這個多,超過了服務器就掛了
ps -eLf | wc -l:查看本服務器進程數
一般出現 -bash: fork: Cannot allocate memory 本機的進程數應該接近或等於pid_max指標值的,此處我已經重啟服務器解決了這個問題,所以顯示進程數較少
當我們確認是因為進程數滿了導致服務器掛了,我們可以
echo 1000000 > /proc/sys/kernel/pid_max:修改pid_max值為1000000
echo "kernel.pid_max=1000000 " >> /etc/sysctl.confsysctl -p:設置永久生效
這樣就可以了,保險起見 然后找到占用空間最大的進程,把它干掉就解決了
top:展示進程視圖,監控服務器進程數值默認進入top時,各進程是按照CPU的占用量來排序的
第一行:
10:01:23 — 當前系統時間
126 days, 14:29 — 系統已經運行了126天14小時29分鍾(在這期間沒有重啟過)
2 users — 當前有2個用戶登錄系統
load average: 1.15, 1.42, 1.44 — load average后面的三個數分別是1分鍾、5分鍾、15分鍾的負載情況
load average數據是每隔5秒鍾檢查一次活躍的進程數,然后按特定算法計算出的數值。如果這個數除以邏輯CPU的數量,結果高於5的時候就表明系統在超負荷運轉了。
Tasks — 任務(進程),系統現在共有183個進程,其中處於運行中的有1個,182個在休眠(sleep),stoped狀態的有0個,zombie狀態(僵屍)的有0個。
6.7% us — 用戶空間占用CPU的百分比。
0.4% sy — 內核空間占用CPU的百分比。
0.0% ni — 改變過優先級的進程占用CPU的百分比
92.9% id — 空閑CPU百分比
0.0% wa — IO等待占用CPU的百分比
0.0% hi — 硬中斷(Hardware IRQ)占用CPU的百分比
0.0% si — 軟中斷(Software Interrupts)占用CPU的百分比
在這里CPU的使用比率和windows概念不同,如果你不理解用戶空間和內核空間,需要充充電了。
第四行:內存狀態
8306544k total — 物理內存總量(8GB)
7775876k used — 使用中的內存總量(7.7GB)
530668k free — 空閑內存總量(530M)
79236k buffers — 緩存的內存量 (79M)
第五行:swap交換分區
2031608k total — 交換區總量(2GB)
2556k used — 使用的交換區總量(2.5M)
2029052k free — 空閑交換區總量(2GB)
4231276k cached — 緩沖的交換區總量(4GB)
PID — 進程id
USER — 進程所有者
PR — 進程優先級
NI — nice值。負值表示高優先級,正值表示低優先級
VIRT — 進程使用的虛擬內存總量,單位kb。VIRT=SWAP+RES
RES — 進程使用的、未被換出的物理內存大小,單位kb。RES=CODE+DATA
SHR — 共享內存大小,單位kb
S — 進程狀態。D=不可中斷的睡眠狀態 R=運行 S=睡眠 T=跟蹤/停止 Z=僵屍進程
%CPU — 上次更新到現在的CPU時間占用百分比
%MEM — 進程使用的物理內存百分比
TIME+ — 進程使用的CPU時間總計,單位1/100秒
COMMAND — 進程名稱(命令名/命令行)


3. 敲擊鍵盤“x”(打開/關閉排序列的加亮效果),top的視圖變化如下:
4、如果要在基本視圖中顯示“CODE”和“DATA”兩個字段,可以通過敲擊“r”和“s”鍵:
top命令的補充:
監控java線程數:
ps -eLf | grep java | wc -l
監控網絡客戶連接數:
netstat -n | grep tcp | grep 偵聽端口 | wc -l
pmap PID
大家都熟悉Linux下可以通過top命令來查看所有進程的內存,CPU等信息。除此之外,還有其他一些命令,可以得到更詳細的信息,例如進程相關
cat /proc/your_PID/status
通過top或ps -ef | grep '進程名' 得到進程的PID。該命令可以提供進程狀態、文件句柄數、內存使用情況等信息。
內存相關
vmstat -s -S M
該可以查看包含內存每個項目的報告,通過-S M或-S k可以指定查看的單位,默認為kb。結合watch命令就可以看到動態變化的報告了。
也可用 cat /proc/meminfo
要看cpu的配置信息可用
cat /proc/cpuinfo
它能顯示諸如CPU核心數,時鍾頻率、CPU型號等信息。
要查看cpu波動情況的,尤其是多核機器上,可使用
mpstat -P ALL 10
該命令可間隔10秒鍾采樣一次CPU的使用情況,每個核的情況都會顯示出來,例如,每個核的idle情況等。
只需查看均值的,可用
iostat -c
IO相關
iostat -P ALL
該命令可查看所有設備使用率、讀寫字節數等信息。
Linux查看物理CPU個數、核數、邏輯CPU個數
# 總核數 = 物理CPU個數 X 每顆物理CPU的核數
# 總邏輯CPU數 = 物理CPU個數 X 每顆物理CPU的核數 X 超線程數
# 查看物理CPU個數
cat /proc/cpuinfo| grep "physical id"| sort| uniq| wc -l
# 查看每個物理CPU中core的個數(即核數)
cat /proc/cpuinfo| grep "cpu cores"| uniq
# 查看邏輯CPU的個數
cat /proc/cpuinfo| grep "processor"| wc -l
查看CPU信息(型號)
cat /proc/cpuinfo | grep name | cut -f2 -d: | uniq -c