1、Hive內部表和外部表的區別?
1、在導入數據到外部表,數據並沒有移動到自己的數據倉庫目錄下,也就是說外部表中的數據並不是由它自己來管理的!而表則不一樣;
2、在刪除表的時候,Hive將會把屬於表的元數據和數據全部刪掉;而刪除外部表的時候,Hive僅僅刪除外部表的元數據,數據是不會刪除的!
那么,應該如何選擇使用哪種表呢?在大多數情況沒有太多的區別,因此選擇只是個人喜好的問題。但是作為一個經驗,如果所有處理都需要由Hive完成,那么你應該創建表,否則使用外部表!
《Hive表與外部表》
2、Hbase的rowkey怎么創建比較好?列族怎么創建比較好?
3、用mapreduce怎么處理數據傾斜問題?
4、hadoop框架中怎么來優化?
5、Hbase內部是什么機制?
6、hdfs的數據壓縮算法
7、hive底層與數據庫交互原理
8、hbase過濾器實現原則