HBase调优案例(三)——Spark访问HBase慢


负载信息:RegionServer:3个

                  Region:5400多个

现象:在使用Spark对HBase进行scan操作时发现有些task执行比较慢

原因分析:查看Spark应用的executor日志,发现查询慢的都是027节点请求的。

     获取此节点的regionServer日志,发现scan的时候有responseTooSlow的打印。

        查询日志发现这段时间在regionServer上出现很多次GC pause的打印,说明当前内存不足。

综上,当前regionServer内存的配置不足以应付高并发状态下的RPC请求。由于实际节点上的业务量/数据量/请求个数存在略微差异,使027节点处理请求时GC出现了延迟。当Spark多并发task执行的时候,GC的pause不能及时地处理查询请求,从而影响整个查询的时间。

 

解决:

  调整HMaster的内存及Handler相关配置

  1.调整HMaster和RegionServer的GC_OPTS(垃圾回收参数)

  RegionServer调整为:

  Xms 6G——>16G

  -Xmx 6G——>16G

  NewSize 64M——>512M

  Max NewSize 128M——>512M

  Max DirectMemorySize 128M——>1024M

 

  HMaster调整为:

  Xms 1G——2G

  -Xmx 1G——>2G

  NewSize 64M——>256M

  Max NewSize 128M——>512M

  Max DirectMemorySize 128M——>512M

 

  2.调整RPC Handler(regionServer上处理RPC请求的线程实例数)

  hbase.regionserver.handler.count 100——>300

  hbase.regionserver.metahandler.count 10——>100

 


免责声明!

本站转载的文章为个人学习借鉴使用,本站对版权不负任何法律责任。如果侵犯了您的隐私权益,请联系本站邮箱yoyou2525@163.com删除。



 
粤ICP备18138465号  © 2018-2025 CODEPRJ.COM