1.存儲格式
textfile
rcfile
orc
parquet
2.存儲方式
按行存儲
-》textfile
按列存儲
-》parquet
3.壓縮比

4.存儲textfile的原文件

並加載數據
5.大小

6.保存為textfile,經過mapreduce

7.結果的大小

8.保存為orc格式

9.大小

10.存儲為parquet

11.大小

12.使用命令求大小
bin/hdfs dfs -du -s -h /user/hive/warehouse/track_log.db/yhd_par

