hbase異常退出（CDH版）

本文轉載自查看原文 2018-09-27 16:00 1179

　　早上，Web頁面沒有了數據，查看storm入庫日志，看到kafka消費者隊列已經滿了，想到可能是剛剛使用的hbase掛了，登錄CDH管理頁面，果然已經掛了，看運行狀態歷史，凌晨12點和4點分別有兩次狀態不正常的記錄；

　　看到出了問題，第一反應就是萬能大法——重啟hbase，結果RegionSever還是起不來；看來得硬着頭皮搞一波；檢查了一番Log文件，發現以下問題

　　　　　　java.lang.OutOfMemoryError: Java heap space

　　第一反應是jvm內存不夠了，在CDM嘗試配置RegionServer，找到下面這項

　　默認是256M，修改成1G試試，重啟RegionSever，結果正常；看來就是默認的JVM內存分小，問題暫時解決。

　　中午，發現CDM里面報警出現了RegionServer出現RegionServer存在安全隱患；看RegionServer日志，發現有頻繁flush操作，還有Memstore請求flush排不上隊，查找日志發現如下：

　　　　　 because overview has an old edit so flush to free WALs after random delay 182886ms

　　查找網絡資料：“這是很明顯的寫入量很小，因為周期性flush線程觸發的行為，比如store很久沒更新了而最新的edit距今超過閾值（默認一小時），那么就會delay一個random時間去執行”

　　接下來，查看歷次觸發的flush產生的文件大小

　　　　grep 'org.apache.hadoop.hbase.regionserver.HStore: Added hdfs' hbase-cmf-hbase-REGIONSERVER-${FQDN_HOSTNAME}.log.out | awk -F 'filesize=' '{print$2}'

　　普遍都在1M左右，看來不是因為Memstore大小引發的flush，查看報警規律，發現大概一小時觸發一次報警，應該是周期性flush線程觸發；暫時到此

免責聲明！

本站轉載的文章為個人學習借鑒使用，本站對版權不負任何法律責任。如果侵犯了您的隱私權益，請聯系本站郵箱yoyou2525@163.com刪除。

猜您在找 編譯HBase1.0.0-cdh5.4.2版本 CDH的 hive 整合 hbase Tomcat異常退出 [How to] Phoenix 與 CDH5.4.2 HBase的整合將CDH中的hive和hbase相互整合使用 hbase regionserver異常宕機 MHA監控進程異常退出 Hbase meta 表異常修復 CDH使用Solr實現HBase二級索引 077 Apache的HBase與cdh的hue集成（不建議不同版本之間的集成）