Linux 內存 占用較高問題排查


Linux 內存 占用較高問題排查

niuhao307523005 2019-04-24 14:31:55 11087 收藏 11
展開
一 查看內存情況
#按 k 查看

free 

#按兆M查看

free -m

 

total:總計物理內存的大小。
used:已使用多大。
free:可用有多少。
Shared:多個進程共享的內存總額。
Buffers/cached:磁盤緩存的大小。
#所以空閑內存=free+buffers+cached=total-used
內存的使用情況
cat /proc/meminfo

查看進程的內存占用
pidstat -r -p 24427 1 5 

內存占用高的前20
ps aux | head -1;ps aux |grep -v PID |sort -rn -k +4 | head -20

動態查看內存占用
slabtop

二 問題定位
 

 cached 占用過高問題
buffer,cached的作用:

     cached主要負責緩存文件使用, 日志文件過大造成cached區內存增大把內存占用完 .
     Free中的buffer和cache:(它們都是占用內存):
     buffer : 作為buffer cache的內存,是塊設備(磁盤)的緩沖區,包括讀、寫磁盤
     cache: 作為page cache的內存, 文件系統的cache,包括讀、寫文件
     如果 cache 的值很大,說明cache住的文件數很多。

linux服務器會自動釋放內存,保障系統運行,但只會釋放夠用的內存,而不會去釋放更多的內存。

解決方法:
手動釋放cached方法有三種(系統默認值是0,釋放之后你需要再改回0值):
釋放前最好sync一下,防止丟數據

sync 在啟動機器或關機之前一定要運行sync命令。記住在任何情況下,慎重地執行sync命令決不會有任何壞處,sync命令強制把磁盤緩沖的所有數據寫入磁盤


To free pagecache: #echo 1 > /proc/sys/vm/drop_caches

To free dentries and inodes: #echo 2 > /proc/sys/vm/drop_caches

To free pagecache, dentries and inodes: #echo 3 > /proc/sys/vm/drop_caches

#常用方法是

sync

echo 1 > /proc/sys/vm/drop_caches

#清除后要還原系統默認配置:
echo 0 > /proc/sys/vm/drop_caches

#查看設置
 sysctl -a | grep drop_caches
補充: echo 字符串 > 文件  就是把字符串內容從定向到文件中

 

這時查看 free  可以看到 cached 降低了很多

三 linux vm內核參數優化設置
(1)vm.min_free_kbytes
sysctl -a | grep min_free_kbytes        #centos6.4默認66M

67584                            該文件表示強制Linux VM最低保留多少空閑內存(Kbytes)。

 

當可用內存低於這個參數時,系統開始回收cache內存,以釋放內存,直到可用內存大於這個值。

#改為1g

命令:sysctl -w  vm.min_free_kbytes=1048576

(如果命令執行不成功,直接編輯文件進行替換即可)

#查看是否改動

sysctl -a | grep min_free_kbytes

 

(1)vm.overcommit_memory

執行grep -i commit  /proc/meminfo

看到CommitLimit和Committed_As參數。

CommitLimit是一個內存分配上限,CommitLimit = 物理內存 * overcommit_ratio(默認50,即50%) + swap大小

Committed_As是已經分配的內存大小。

--------

vm.overcommit_memory文件指定了內核針對內存分配的策略,其值可以是0、1、2                             
0: (默認)表示內核將檢查是否有足夠的可用內存供應用進程使用;如果有足夠的可用內存,內存申請允許;否則,內存申請失敗,並把錯誤返回給應用進程。0 即是啟發式的overcommitting handle,會盡量減少swap的使用,root可以分配比一般用戶略多的內存
1: 表示內核允許分配所有的物理內存,而不管當前的內存狀態如何,允許超過CommitLimit,直至內存用完為止。在數據庫服務器上不建議設置為1,從而盡量避免使用swap.
2: 表示不允許超過CommitLimit值
 
(2)vm.overcommit_ratio

默認值為:50 (即50%)

這個參數值只有在vm.overcommit_memory=2的情況下,這個參數才會生效。

------------------------------------------------------------------------------

 
vm.vfs_cache_pressure

該項表示內核回收用於directory和inode cache內存的傾向:

缺省值100表示內核將根據pagecache和swapcache,把directory和inode cache保持在一個合理的百分比

降低該值低於100,將導致內核傾向於保留directory和inode cache

增加該值超過100,將導致內核傾向於回收directory和inode cache。

網上文章建議 執行命令:

sysctl -a | grep vfs_cache_pressure

sysctl -w  vm.vfs_cache_pressure=200  

其實一般情況下不需要調整,只有在極端場景下才建議進行調整,只有此時,才有必要進行調優,這也是調優的意義所在。

 

vm.dirty_background_ratio   默認為10

所有全局系統進程的臟頁數量達到系統總內存的多大比例后,就會觸發pdflush/flush/kdmflush等后台回寫進程運行。

將vm.dirty_background_ratio設置為5-10,將vm.dirty_ratio設置為它的兩倍左右,以確保能持續將臟數據刷新到磁盤,避免瞬間I/O寫,產生嚴重等待(和MySQL中的innodb_max_dirty_pages_pct類似)

vm.dirty_ratio   默認為20

單個進程的臟頁數量達到系統總內存的多大比例后,就會觸發pdflush/flush/kdmflush等后台回寫進程運行。

--------------------------------------------------

vm.panic_on_oom    默認為0開啟    為1時表示關閉此功能

等於0時,表示當內存耗盡時,內核會觸發OOM killer殺掉最耗內存的進程。

當OOM Killer被啟動時,通過觀察進程自動計算得出各當前進程的得分 /proc/<PID>/oom_score,分值越高越容易被kill掉。

而且計算分值時主要參照 /proc/<PID>/oom_adj ,  oom_adj 取值范圍從-17到15,當等於-17時表示在任何時候此進程都不會被 oom killer kill掉(適用於mysql)。

    /proc/[pid]/oom_adj ,該pid進程被oom killer殺掉的權重,介於 [-17,15]之間,越高的權重,意味着更可能被oom killer選中,-17表示禁止被kill掉。

    /proc/[pid]/oom_score,當前該pid進程的被kill的分數,越高的分數意味着越可能被kill,這個數值是根據oom_adj運算后的結果,是oom_killer的主要參考。

    sysctl 下有2個可配置選項:

                vm.panic_on_oom = 0                      #內存不夠時內核是否直接panic                

       vm.oom_kill_allocating_task = 1       #oom-killer是否選擇當前正在申請內存的進程進行kill 


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM