hive和mysql的區別,以及hive的介紹


1.查詢語言不同:hive是hql語言,mysql是sql語句;
 
2.數據存儲位置不同:hive是把數據存儲在hdfs上,而mysql數據是存儲在自己的系統中;
 
3.數據格式:hive數據格式可以用戶自定義,mysql有自己的系統定義格式;
 
4.數據更新:hive不支持數據更新,只可以讀,不可以寫,而sql支持數據更新;
 
5.索引:hive沒有索引,因此查詢數據的時候是通過mapreduce很暴力的把數據都查詢一遍,也造成了hive查詢數據速度很慢的原因,而mysql有索引;
 
6.延遲性:hive延遲性高,原因就是上邊一點所說的,而mysql延遲性低;
 
7.數據規模:hive存儲的數據量超級大,而mysql只是存儲一些少量的業務數據;
 
8.底層執行原理:hive底層是用的mapreduce,而mysql是excutor執行器;
 

原文鏈接:https://blog.csdn.net/Sunshine_2211468152/article/details/83031356
 
 
 
 
apache hive 是構建在apache hadoop上的數據倉庫,適合處理海量的離線數據。
 
hive的數據構成是由HDFS+元數據組成,而元數據表對hive極其重要。
 
先看下元數據表結構

 

 可以理解為通過元數據表可以找到HDFS

 


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM