原文地址:http://qiao-wl.blog.163.com/blog/static/624875662012814102021703/
hbase 異常處理
2013-01-08 15:37:19,565 WARN org.apache.hadoop.ipc.HBaseServer: IPC Server listener on 60000: readAndProcess threw exception java.io.IOException: Connection reset by peer. Count of bytes read: 0
java.io.IOException: Connection reset by peer
at sun.nio.ch.FileDispatcher.read0(Native Method)
at sun.nio.ch.SocketDispatcher.read(SocketDispatcher.java:21)
at sun.nio.ch.IOUtil.readIntoNativeBuffer(IOUtil.java:198)
at sun.nio.ch.IOUtil.read(IOUtil.java:171)
at sun.nio.ch.SocketChannelImpl.read(SocketChannelImpl.java:243)
at org.apache.hadoop.hbase.ipc.HBaseServer.channelIO(HBaseServer.java:1389)
at org.apache.hadoop.hbase.ipc.HBaseServer.channelRead(HBaseServer.java:1359)
at org.apache.hadoop.hbase.ipc.HBaseServer$Connection.readAndProcess(HBaseServer.java:940)
at org.apache.hadoop.hbase.ipc.HBaseServer$Listener.doRead(HBaseServer.java:522)
at org.apache.hadoop.hbase.ipc.HBaseServer$Listener$Reader.run(HBaseServer.java:316)
at java.util.concurrent.ThreadPoolExecutor$Worker.runTask(ThreadPoolExecutor.java:886)
at java.util.concurrent.ThreadPoolExecutor$Worker.run(ThreadPoolExecutor.java:908)
at java.lang.Thread.run(Thread.java:662)
透過現象看本 質:
hbase客戶端每次和regionserver交互的時候,都會在服務器端生成一個租約(Lease),租約的有效期由參數hbase.regionserver.lease.period確定。
客戶端去regionserver取 數據的時候,hbase中存得數據量很大並且很多region的時候的,客戶端請求的region不在內存中,或是沒有被cache住,需要從磁盤中加 載,如果這時候加載需要的時間超過hbase.regionserver.lease.period所配置的時間,並且客戶端沒有和 regionserver報告其還活着,那么regionserver就會認為本次租約已經過期,並從LeaseQueue從刪除掉本次租約,當 regionserver加載完成后,拿已經被刪除的租約再去取數據的時候,就會出現如上的錯誤現象。
解 決的辦法:
1、適當的增大 hbase.regionserver.lease.period參數的值,默認是1分鍾
2、增大regionserver的cache大小