Hbase數據不一致修復


Region數據不一致是什么

一致性是指Region在meta中的meta表信息、在線Regionserver的Region信息和hdfs的Regioninfo的Region信息的一致。

 

 

HBCK檢查什么

a.集群所有region都被assign,且被deploy到唯一一台regionserver上

b.該region的狀態在內存、hbase:meta表及zk上是否一致

c.對集群中任意一張表,每個rowkey都僅能存在於一個region區間

 

一、局部的修復

1如果出現數據不一致,修復是要最大限度的降低可能出現的風險,使用以下命令對region進行修復風險較低:

 

1.1 hbase  hbck -fixAssignments

命令解釋:修復region 沒有分配(unassigned),錯誤分配(incorrectly assigned)以及多次分配(multiply assigned)的問題

 

1.2 hbase hbck -fixMeta

命令解釋:刪除META表里有記錄但HDFS里沒有數據記錄的region

                  添加HDFS里有數據但是META表里沒有記錄的region到META表

 

1.3hbase hbck -repairHoles

命令解釋:hbase hbck -fixAssignments -fixMeta -fixHdfsHoles

 

-fixHdfsHoles的作用:

命令解釋:如果rowkey出現空洞,即相鄰的兩個region的rowkey不連續,則使用這個參數會在HDFS里面創建一個新的region

創建新的region之后要使用-fixMeta和-fixAssignments參數來使用掛載這個region,所以一般和前兩個參數一起使用

 

 

二、region重疊修復

進行以下操作非常危險,因為這些操作會修復文件系統,需要謹慎操作!

進行以下操作前使用hbck -details 查看詳細的問題,如果需要進行修復先停掉應用,如果執行以下命令同時有數據操作可能會造成不可期的異常

2.1 hbase hbck -fixHdfsOrphants

命令解釋:將文件系統中沒有metadata文件(.regioninfo)的region目錄加入到hbase中,即創建.regioninfo目錄並

region 分配到regionserver

2.2hbase hbck -fixHdfsOverlaps

命令解釋:通過2種方式可以將rowkey有重疊的region合並

                 1).merge:將重疊的region合並成一個大的region

                 2).sideline將region重疊的部分去掉,並將重疊的數據先寫入到臨時文件,然后再導入進來

                 如果重疊的數據很大,直接合並成一個大的region會產生大量的split和compact操作,可以通過以下參數控制region過大

                -maxMerger 合並重疊region的最大數量

                -sidelineBigOverlaps假如有大於maxMerge個數的region重疊,則采用sideline方式處理與其他region的重疊

                -maxOverlapsToSideline 如果用sideline方式處理重疊region,最多sideline  n個region

 

2.3hbase hbck -repair

命令解釋:等價於:hbase hbck -fixAssignments -fixMeta -fixHdfsHoles -fixHdfsOrphans -fixHdfsOverlaps -fixVersionFile -sidelineBigOverlaps

可指定表名:hbase hbck -repair Table1 Table2

 

2.4hbase hbck -fixMetaOnly -fixAssignments

 

命令解釋:如果只有META表的region不一致,則可以使用這個命令恢復

2.5hbase hbck -fixVersionFile

 

命令解釋:Hbase 的數據文件啟動是需要一個version file ,如果這個文件丟失,可用這個命令新建一個,但是要保障hbck 版本

和Hbase集群的版本是一樣的

 

2.6hbase org.apache.hadoop.hbase.util.hbck.offlineMetaRepair

命令解釋:如果ROOT表和META表都出現問題了HBASE無法啟動,可用這個命令來新建一個新的ROOT和META表

這個命令的前提是HBASE 已經關閉,執行時它會從hbase的home目錄加載hbase的相關信息(.regioninfo).如果表的信息

是完整的就會創建新的root和meta目錄及數據

 

2.7hbase hbck -fixSplitParents

命令解釋:

當region做split操作的時候,父region會被自動清理掉,但是有時候子region在父region被清除之前又做了split,造成有些延遲離線的

父region存在於META和HDFS中,但是沒有部署,HBASE又不能清除他們。這種情況下可以使用此命令重置這些在META表中的region

為在線狀態並且沒有split,然后就可以使用之前的修復命令把這個region修復

三、根據報錯來確定使用哪個參數

不一致

  異常信息

修復命令

Region信息在meta數據和hdfs都不存在,但是卻被部署到Regionserver。

errors.reportError(ERROR_CODE.NOT_IN_META_HDFS, "Region "

    + descriptiveName + ", key=" + key + ", not on HDFS or in hbase:meta but " +

    "deployed on " + Joiner.on(", ").join(hbi.deployedOn));

FixAssignments

Region在meta數據表不存在,也沒有被部署到Regionserver,但是數據在hdfs上。

errors.reportError(ERROR_CODE.NOT_IN_META_OR_DEPLOYED, "Region "

    + descriptiveName + " on HDFS, but not listed in hbase:meta " +

    "or deployed on any Region server"

FixMeta

FixAssignments

Region在meta數據表不存在,但是在Regionserver部署,數據在hdfs上。

errors.reportError(ERROR_CODE.NOT_IN_META, "Region " + descriptiveName

    + " not in META, but deployed on " + Joiner.on(", ").join(hbi.deployedOn));

FixMeta

FixAssignments

Region只存在meta中,但在hdfs和rs上都不存在

errors.reportError(ERROR_CODE.NOT_IN_HDFS_OR_DEPLOYED, "Region "

    + descriptiveName + " found in META, but not in HDFS "

    + "or deployed on any Region server.")

FixMeta

Region在meta表和Regionserver中存在,但是在hdfs不存在。

errors.reportError(ERROR_CODE.NOT_IN_HDFS, "Region " + descriptiveName

    + " found in META, but not in HDFS, " +

    "and deployed on " + Joiner.on(", ").join(hbi.deployedOn));

FixAssignments

FixMeta

Region在meta表和hdfs中存在,且Region所在表沒有處於disable狀態,但是沒有部署。

errors.reportError(ERROR_CODE.NOT_DEPLOYED, "Region " + descriptiveName
    + " not deployed on any Region server.");

FixAssignments

Region處於disabling或disabled

errors.reportError(ERROR_CODE.SHOULD_NOT_BE_DEPLOYED,

    "Region " + descriptiveName + " should not be deployed according " +

    "to META, but is deployed on " + Joiner.on(", ").join(hbi.deployedOn));

FixAssignments

Region多分配

errors.reportError(ERROR_CODE.MULTI_DEPLOYED, "Region " + descriptiveName

    + " is listed in hbase:meta on Region server " + hbi.metaEntry.RegionServer

    + " but is multiply assigned to Region servers " +

    Joiner.on(", ").join(hbi.deployedOn));

FixAssignments

Region在meta表的Regionserver信息與實際部署的Regionserver不一致。

errors.reportError(ERROR_CODE.SERVER_DOES_NOT_MATCH_META, "Region "

    + descriptiveName + " listed in hbase:meta on Region server " +

    hbi.metaEntry.RegionServer + " but found on Region server " +

    hbi.deployedOn.get(0));

FixAssignments

region在meta和hdfs存在,且處於切分狀態,但子region的信息在meta信息缺失。

errors.reportError(ERROR_CODE.LINGERING_SPLIT_PARENT, "Region "

    + descriptiveName + " is a split parent in META, in HDFS, "

    + "and not deployed on any region server. This could be transient, "

    + "consider to run the catalog janitor first!");

fixSplitParents

 

備注參考:

HBCK 參數解釋

  • -fixAssignments 修復沒有assign、assign不正確或者同時assign到多台RegionServer的問題region。
  • -fixMeta 主要修復.regioninfo文件和hbase:meta元數據表的不一致。修復的原則是以HDFS文件為准:如果region在HDFS上存在,但在hbase.meta表中不存在,就會在hbase:meta表中添加一條記錄。反之如果在HDFS上不存在,而在hbase:meta表中存在,就會將hbase:meta表中對應的記錄刪除。
  • -fixHdfsHoles :嘗試修復HDFS中的Region黑洞;
  • -fixHdfsOrphans:嘗試修復hdfs中沒有.regioninfo文件的region目錄
  • -fixTableOrphans  嘗試修復hdfs中沒有.tableinfo文件的table目錄(只支持在線模式)
  • -fixHdfsOverlaps   修復重疊
  • -fixVersionFile  嘗試修復hdfs中hbase.version文件缺失的問題;


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM