hive外部表刪除遇到的一個坑
操作步驟
- 創建某個表(
create external table xxx location xxx
) - 插入數據(
insert xxx select xxx from xxx
) - 刪除表(
drop table xxx
) - 重新創建
- 插入數據
- 查詢數據
現象
- 查詢數據發現部分第一次插入的數據
- 查詢數據量發現大於第二次插入的數量
原因
與其說是坑,不如說是自己忽略了一點:
- 插入的是外部表,當drop表之后,數據並沒有刪除
- 第二次創建表location指向的還是原來的位置
- 也就導致了上述的問題
所以,如果外表想重建並且指向原來的位置,需要注意不要忘記刪掉原來位置的文件