1.查詢語言不同:hive是hql語言,mysql是sql語句;
2.數據存儲位置不同:hive是把數據存儲在hdfs上,而mysql數據是存儲在自己的系統中;
3.數據格式:hive數據格式可以用戶自定義,mysql有自己的系統定義格式;
4.數據更新:hive不支持數據更新,只可以讀,不可以寫,而sql支持數據更新;
5.索引:hive沒有索引,因此查詢數據的時候是通過mapreduce很暴力的把數據都查詢一遍,也造成了hive查詢數據速度很慢的原因,而mysql有索引;
6.延遲性:hive延遲性高,原因就是上邊一點所說的,而mysql延遲性低;
7.數據規模:hive存儲的數據量超級大,而mysql只是存儲一些少量的業務數據;
8.底層執行原理:hive底層是用的mapreduce,而mysql是excutor執行器;
原文鏈接:https://blog.csdn.net/Sunshine_2211468152/article/details/83031356
apache hive 是構建在apache hadoop上的數據倉庫,適合處理海量的離線數據。
hive的數據構成是由HDFS+元數據組成,而元數據表對hive極其重要。
先看下元數據表結構
可以理解為通過元數據表可以找到HDFS
