最近公司一台線上服務器的hbase的regionserver掛掉之后起不起來報錯OOM。
- 這台機器同時裝有cassandra,於是停掉cassandra釋放內存,重啟regionserver失敗,同時cassandra再嘗試啟動也報錯Caused by: java.io.IOException: java.io.IOException: error=12, Cannot allocate memory
- ps -ef發現有很多類似/bin/bash /opt/cloudera-manager/cm-5.3.0/lib64/cmf/service/hbase/hbase.sh regionserver start的進程在運行,全部殺掉后依然無法啟動regionserver和cassandra
- 重啟機器依然無效
- 參考https://stackoverflow.com/questions/1124771/how-to-solve-java-io-ioexception-error-12-cannot-allocate-memory-calling-run后,使用echo 0 > /proc/sys/vm/overcommit_memory解決問題
后續依然要加強對內存管理的學習