理解Hbase RowKey的字典排序；HBase Rowkey的散列与预分区设计

本文转载自查看原文 2018-07-19 17:20 1089 HBase Rowkey的散列与预分区设计/ 理解Hbase RowKey的字典排序/ 大数据

HBase是三维有序存储的，是指rowkey（行键），column key（column family和qualifier）和TimeStamp（时间戳）这个三个维度是依照ASCII码表排序的。

HBase中，表会被划分为1...n个Region，被托管在RegionServer中。Region二个重要的属性:StartKey与EndKey表示这个Region维护的rowKey范围，当我们要读/写数据时，如果rowKey落在某个start-end key范围内，那么就会定位到目标region并且读/写到相关的数据。简单地说，有那么一点点类似人群划分，1-15岁为小朋友,16-39岁为年轻人，40-64为中年人,65岁以上为老年人。(这些数值都是拍脑袋出来的，只是举例，非真实),然后某人找队伍，然后根据年龄，处于哪个范围，就找到它所属的队伍。
然后，默认地，当我们只是通过HBaseAdmin指定TableDescriptor来创建一张表时，只有一个region,正处于混沌时期，start-end key无边界,可谓海纳百川。啥样的rowKey都可以接受，都往这个region里装，然而，当数据越来越多，region的size越来越大时，大到一定的阀值，hbase认为再往这个region里塞数据已经不合适了，就会找到一个midKey将region一分为二，成为2个region,这个过程称为分裂(region-split).而midKey则为这二个region的临界，左为N无下界，右为M无上界。< midKey则为阴被塞到N区，> midKey则会被塞到M区。

参考：https://blog.csdn.net/zhaominpro/article/details/79423328

https://www.cnblogs.com/bdifn/p/3801737.html

免责声明！

本站转载的文章为个人学习借鉴使用，本站对版权不负任何法律责任。如果侵犯了您的隐私权益，请联系本站邮箱yoyou2525@163.com删除。

猜您在找 HBase Rowkey的散列与预分区设计 HBase表预分区 hbase HexStringSplit 预分区 HBase之六：HBase的RowKey设计 hbase 预分区与自动分区 HBase RowKey与索引设计 HBase rowkey设计实例 Hbase笔记——RowKey设计 hbase行键（rowkey）设计 HBase的rowkey设计（含实例）