最近在做數據分析,就把 hbase 里數據挖出來曬曬。
挖之前先看看 池子有多大,哈哈哈
查看hbase表大小。
進入 hbase 所在服務器
# hbase shell 進入 hbase 庫
# list_namespace 列出所有命名空間
# describe_namspace 'hbase' 查看指定命名空間
# list_namespace_table 'default' 查看指定命名空間下的表
也可以
# list 列出所有表名
查看 hbase指定表大小
網上有句 # hdfs dfs -du -h /apps/hbase/data/data/default/
我在服務器上試了試,
但是我這里並沒有 /apps 文件,於是查找了 hbase安裝目錄
# whereis hbase
查了 hbase 所在 的三個文件下都沒有 /data/default 文件。
還有個命令 #hdfs dfs -du -h / 查看總占用空間,執行有效果
第一列:目錄下總文件大小
第二列:目錄下所有文件在集群上的總存儲大小,和集群數量有關
第三列:查詢目錄
在第一列竟然找到 /hbase 地址了、
再次執行命令 # hdfs dfs -du -h /hbase/data/data/default/
沒反應?
偶然又查到另一個命令
# hadoop fs -du /hbase/data/default -- 親測可用 哈哈,不過顯示的 是 kb
# hadoop fs -du -h /hbase/data/default -- 加上 -h 加單位顯示。
可以看到我的hbase 表 ,當前 htable_historical_track 表和 xny_data_hbase 占用空間較多。
后面就是查看 hbase 表數據量、每日增長量之類的事情了。