Hadoop面試題


1、Hive內部表和外部表的區別?

  1、在導入數據到外部表,數據並沒有移動到自己的數據倉庫目錄下,也就是說外部表中的數據並不是由它自己來管理的!而表則不一樣;
  2、在刪除表的時候,Hive將會把屬於表的元數據和數據全部刪掉;而刪除外部表的時候,Hive僅僅刪除外部表的元數據,數據是不會刪除的!
  那么,應該如何選擇使用哪種表呢?在大多數情況沒有太多的區別,因此選擇只是個人喜好的問題。但是作為一個經驗,如果所有處理都需要由Hive完成,那么你應該創建表,否則使用外部表!
《Hive表與外部表》

2、Hbase的rowkey怎么創建比較好?列族怎么創建比較好?

3、用mapreduce怎么處理數據傾斜問題?

4、hadoop框架中怎么來優化?

5、Hbase內部是什么機制?

6、hdfs的數據壓縮算法

7、hive底層與數據庫交互原理

8、hbase過濾器實現原則


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM