hive 分区表与数据产生关联的三种方式


所谓关联,可以理解为能够使用select查询到

1.load

这是最常用的一种方式

load data [local] inpath "数据路径" into table table_name partition(分区字段)

使用load加载数据会自动创建分区的,这样你加载的数据就会和分区表进行关联,之后select就可以了

 

2.修复命令

这种方式是先使用hive创建分区目录,然后用put上传数据,最后使用msck repair进行修复,所谓修复实质是创建分区,即Added partition to metastore ...

dfs -mkdir -p  "分区路径"

dfs -put  "数据路径" "分区路径"

最后修复

msck repair table table_name

 

3.上传数据后使用alter增加分区

dfs -mkdir -p  "分区路径"

dfs -put  "数据路径" "分区路径"

alter table table_name add partition(xxx)

之后也可以查询到

 

综上,load方式最为简洁

 


免责声明!

本站转载的文章为个人学习借鉴使用,本站对版权不负任何法律责任。如果侵犯了您的隐私权益,请联系本站邮箱yoyou2525@163.com删除。



 
粤ICP备18138465号  © 2018-2025 CODEPRJ.COM