-bash: fork: Cannot allocate memory問題，進程數滿了的解決辦法

本文轉載自查看原文 2019-01-08 09:44 27095 進程/ Linux服務器命令

　　今天一大早來到公司就發現一台遠程服務器的進程滿了，無法連接上遠程服務器，如下圖所示：

　　出現這種情況，主要是因為進程跑滿了，memory被消耗光了，無法為其他的操作，包括vnc操作命令和SSH連接分配內存，我們可以用兩個辦法：

　　1、init 6（重啟服務器，注意，不是重啟tomcat）

　　大家都知道，死機了就重啟開機嘛，要是不行init 6 不行在使用reboot強制重啟(可能需要多敲幾次)

　　第一種比較粗暴，通常情況下我們選擇第二種：

　　2、

　　free：通過free命令查看內存剩余可用情況(這個命令可能需要多敲幾遍)

　　命令可帶參數：

　　-b 　以Byte為單位顯示內存使用情況。

　　-k 　以KB為單位顯示內存使用情況。

　　-m 　以MB為單位顯示內存使用情況。

　　-g 以GB為單位顯示內存使用情況。

　　-o 　不顯示緩沖區調節列。

　　-s<間隔秒數> 　持續觀察內存使用狀況。

　　-t 　顯示內存總和列。

　　-V 　顯示版本信息。

　　頁面顯示參數解釋：

　　total:總計物理內存的大小。

　　used:已使用多大。

　　free:可用有多少。

　　Shared:多個進程共享的內存總額。

　　Buffers/cached:磁盤緩存的大小

Swap:交換分區(虛擬內存)情況；Mem:實際內存的使用情況

　　sysctl kernel.pid_max：查看最大進程數

主要是查看pid_max指標的，pid_max是Linux內核用來限制進程數的一個最大指標，換言之，即最大允許進程這個多，超過了服務器就掛了

　　ps -eLf | wc -l：查看本服務器進程數

一般出現 -bash: fork: Cannot allocate memory 本機的進程數應該接近或等於pid_max指標值的，此處我已經重啟服務器解決了這個問題，所以顯示進程數較少

當我們確認是因為進程數滿了導致服務器掛了，我們可以

　　echo 1000000 > /proc/sys/kernel/pid_max：修改pid_max值為1000000

　　echo "kernel.pid_max=1000000 " >> /etc/sysctl.confsysctl -p：設置永久生效

這樣就可以了，保險起見然后找到占用空間最大的進程，把它干掉就解決了

　　top:展示進程視圖，監控服務器進程數值默認進入top時，各進程是按照CPU的占用量來排序的

第一行：
10:01:23 — 當前系統時間
126 days, 14:29 — 系統已經運行了126天14小時29分鍾（在這期間沒有重啟過）
2 users — 當前有2個用戶登錄系統
load average: 1.15, 1.42, 1.44 — load average后面的三個數分別是1分鍾、5分鍾、15分鍾的負載情況

load average數據是每隔5秒鍾檢查一次活躍的進程數，然后按特定算法計算出的數值。如果這個數除以邏輯CPU的數量，結果高於5的時候就表明系統在超負荷運轉了。

          第二行： 
         
Tasks — 任務（進程），系統現在共有183個進程，其中處於運行中的有1個，182個在休眠（sleep），stoped狀態的有0個，zombie狀態（僵屍）的有0個。

          第三行：cpu狀態 
         
7% us — 用戶空間占用CPU的百分比。 
         
4% sy — 內核空間占用CPU的百分比。 
         
0% ni — 改變過優先級的進程占用CPU的百分比 
         
9% id — 空閑CPU百分比 
         
0% wa — IO等待占用CPU的百分比 
         
0% hi — 硬中斷（Hardware IRQ）占用CPU的百分比 
         
0% si — 軟中斷（Software Interrupts）占用CPU的百分比

在這里CPU的使用比率和windows概念不同，如果你不理解用戶空間和內核空間，需要充充電了。

 
第四行：內存狀態 
         
8306544k total — 物理內存總量（8GB） 
         
7775876k used — 使用中的內存總量（7.7GB） 
         
530668k free — 空閑內存總量（530M） 
         
79236k buffers — 緩存的內存量 （79M）

 
第五行：swap交換分區 
         
2031608k total — 交換區總量（2GB） 
         
2556k used — 使用的交換區總量（2.5M） 
         
2029052k free — 空閑交換區總量（2GB） 
         
4231276k cached — 緩沖的交換區總量（4GB）

          第六行以下：各進程（任務）的狀態監控 
         
PID — 進程id 
         
USER — 進程所有者 
         
PR — 進程優先級 
         
NI — nice值。負值表示高優先級，正值表示低優先級 
         
VIRT — 進程使用的虛擬內存總量，單位kb。VIRT=SWAP+RES 
         
RES — 進程使用的、未被換出的物理內存大小，單位kb。RES=CODE+DATA 
         
SHR — 共享內存大小，單位kb 
         
S — 進程狀態。D=不可中斷的睡眠狀態 R=運行 S=睡眠 T=跟蹤/停止 Z=僵屍進程 
         
%CPU — 上次更新到現在的CPU時間占用百分比 
         
%MEM — 進程使用的物理內存百分比 
         
TIME+ — 進程使用的CPU時間總計，單位1/100秒 
         
COMMAND — 進程名稱（命令名/命令行）

擴展：top命令的多U多核CPU監控

 
         1、在top基本視圖中，按鍵盤數字“1”，可監控每個邏輯CPU的狀況： 
        

 
         2、敲擊鍵盤“b”（打開/關閉加亮效果），top的視圖變化如下 
        

3. 敲擊鍵盤“x”（打開/關閉排序列的加亮效果），top的視圖變化如下：

4、如果要在基本視圖中顯示“CODE”和“DATA”兩個字段，可以通過敲擊“r”和“s”鍵：

top命令的補充：

監控java線程數：

ps -eLf | grep java | wc -l

監控網絡客戶連接數：

netstat -n | grep tcp | grep 偵聽端口 | wc -l

pmap PID

大家都熟悉Linux下可以通過top命令來查看所有進程的內存，CPU等信息。除此之外，還有其他一些命令，可以得到更詳細的信息，例如進程相關

cat /proc/your_PID/status

通過top或ps -ef | grep '進程名' 得到進程的PID。該命令可以提供進程狀態、文件句柄數、內存使用情況等信息。
內存相關
vmstat -s -S M
該可以查看包含內存每個項目的報告，通過-S M或-S k可以指定查看的單位，默認為kb。結合watch命令就可以看到動態變化的報告了。

也可用 cat /proc/meminfo

要看cpu的配置信息可用

cat /proc/cpuinfo

它能顯示諸如CPU核心數，時鍾頻率、CPU型號等信息。

要查看cpu波動情況的，尤其是多核機器上，可使用

mpstat -P ALL 10

該命令可間隔10秒鍾采樣一次CPU的使用情況，每個核的情況都會顯示出來，例如，每個核的idle情況等。
只需查看均值的，可用
iostat -c
IO相關
iostat -P ALL
該命令可查看所有設備使用率、讀寫字節數等信息。

Linux查看物理CPU個數、核數、邏輯CPU個數

# 總核數 = 物理CPU個數 X 每顆物理CPU的核數

# 總邏輯CPU數 = 物理CPU個數 X 每顆物理CPU的核數 X 超線程數

# 查看物理CPU個數

cat /proc/cpuinfo| grep "physical id"| sort| uniq| wc -l

# 查看每個物理CPU中core的個數(即核數)

cat /proc/cpuinfo| grep "cpu cores"| uniq

# 查看邏輯CPU的個數

cat /proc/cpuinfo| grep "processor"| wc -l

查看CPU信息（型號）
cat /proc/cpuinfo | grep name | cut -f2 -d: | uniq -c

免責聲明！

本站轉載的文章為個人學習借鑒使用，本站對版權不負任何法律責任。如果侵犯了您的隱私權益，請聯系本站郵箱yoyou2525@163.com刪除。