[Android Memory] Linux下malloc函數和OOM Killer


http://www.linuxidc.com/Linux/2010-09/28364.htm
Linux下malloc函數主要用來在用戶空間從heap申請內存,申請成功返回指向所分配內存的指針,申請失敗返回NULL。默認情況下,Linux內核使用“樂觀的”分配內存策略,首先粗略估計系統可使用的內存數,然后分配內存,但是在使用的時候才真正把這塊分配的內存給你。這樣一來,即使用malloc申請內存沒有返回NULL,你也不一定能完全使用這塊內存,特別是在一次或連續多次申請很多內存的時候。
 
如果一直連續用malloc申請內存,而不真正使用,所申請的內存總數可以超過真正可以使用的內存數。但是當真正使用這塊內存,比如用memset或bzero函數一次性把所申請到的大塊內存“使用掉”,Linux系統就會Out Of Memory,這個時候OOM Killer就會kill掉用戶空間的其他進程來騰出更多可使用內存。
 
OOM Killer根據OOM score來決定kill哪個進程,OOM score可以看/proc/<PID>/oom_score,score由badness函數計算得出,根據進程運行時間長短,進程優先級,進程所使用的內存數等等。可以通過/proc/<PID>/oom_adj來干預計算socre,這個值的取值范圍是-17~15,如果是-17該進程就永遠不會被kill(這個可能也和內核版本有關,不見得所有內核版本都支持,得實際試試)。
 
“默認情況”Linux是這種做的,“默認情況”是指/proc/sys/vm/overcommit_memory為0的時候。這個參數也可以調整,如果為1表示“來着不拒”,只要你malloc過來申請,我啥都不做,立馬給你分配內存,這樣的話性能就會有大幅度的提高;如果為2表示Linux會精確計算所有可使用的內存和所申請的內存,如果所申請的超過的可使用的內存數就返回NULL。可使用的內存值計算方法,虛擬內存(swap)+ /proc/sys/vm/overcommit_memory(百分比) × 物理內存。/proc/sys/vm/overcommit_memory默認值為50,計算起來就是50%的物理內存數。
 
Linux自身內核會占一部分內存,還有buffer/cache所占用的內存,所以實際上能被malloc申請后使用的內存並非物理內存大小,demsg的輸出里面包含了相關信息(如果看不到,可能是被別的信息沖掉了,重啟系統,在系統起來后馬上看):
Memory: 2071220k/2097152k available (2122k kernel code, 24584k reserved, 884k data, 228k init, 1179584k highmem)
 
關於OOM Killer的proc文件系統
 
http://book.2cto.com/201302/16321.html
 

下面開始介紹與OOM Killer相關的proc文件系統。
/proc/<PID>/oom_adj

為/proc/<PID>/oom_adj設置值就可以調整得分。調整值的范圍為–16~15。正的值容易被OOM Killer選定。負值可能性較低。例如,當指定3時,得分就變為23倍;當指定–5時,得分就變為1/25。

“–17”是一個特殊的值。如果設置為–17,就會禁止OOM Killer發出的信號(從Linux 2.6.12開始支持設置–17)。

在OOM Killer運行的情況下,為了實現遠程登錄而想要將sshd排除在對象外時,可以執行下列命令。
# cat /proc/'cat /var/run/sshd.pid'/oom_score
15
# echo -17 >  /proc/'cat /var/run/sshd.pid'/oom_adj
# tail /proc/'cat /var/run/sshd.pid'/oom_*
==> /proc/2278/oom_adj <==
-17
==> /proc/2278/oom_score <==
0                               /*得分變成0*/

Linux 2.6.18開始可以使用/proc/<PID>/oom_adj。內容記載在Documentation /filesystems/proc.txt中。
/proc/sys/vm/panic_on_oom

將/proc/sys/vm/panic_on_oom設置為1時,在OOM Killer運行時可以不發送進程信號,而是使內核產生重大故障。
# echo 1 > /proc/sys/vm/panic_on_oom
/proc/sys/vm/oom_kill_allocating_task

從Linux 2.6.24開始proc文件系統就有oom_kill_allocating_task。如果對此設置除0以外的值,則促使OOM Killer運行的進程自身將接收信號。此處省略對所有進程的得分計算過程。
# echo 1 > /proc/sys/vm/oom_kill_allocating_task

這樣就不需要參照所有進程,但是也不會考慮進程的優先級和root權限等,只發送信號。
/proc/sys/vm/oom_dump_tasks

從Linux 2.6.25開始,將oom_dump_tasks設置為除0以外的值時,在OOM Killer運行時的輸出中會增加進程的列表信息。

下面為設置示例。
# echo 1 > /proc/sys/vm/oom_dump_tasks

列表信息顯示如下,可以使用dmesg或syslog來確認。
[ pid ]   uid  tgid total_vm      rss cpu oom_adj name
[    1]     0     1     2580        1   0       0 init
[  500]     0   500     3231        0   1     -17 udevd
[ 2736]     0  2736     1470        1   0       0 syslogd
[ 2741]     0  2741      944        0   0       0 klogd
[ 2765]    81  2765     5307        0   0       0 dbus-daemon
[ 2861]     0  2861      944        0   0       0 acpid
...
[ 3320]     0  3320   525842   241215   1       0 stress
/proc/<PID>/oom_score_adj

從Linux 2.6.36開始都安裝了/proc/<PID>/oom_score_adj,此后將替換為/proc/ <PID>/oom_adj。詳細內容請參考Documentation/feature-removal-schedules.txt。即使當前是對/proc/<PID>/oom_adj進行的設置,在內核內部進行變換后的值也是針對/proc/<PID>/oom_score_adj設置的。

/proc/<PID>/oom_score_adj可以設置–1000~1000之間的值。設置為–1000時,該進程就被排除在OOM Killer強制終止的對象外。

在內核2.6.36以后的版本中寫入oom_adj,只會輸出一次如下的信息。
# dmesg
.....
udevd (60): /proc/60/oom_adj is deprecated, please use /proc/60/oom_score_adj instead.


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM