hive和mysql的区别,以及hive的介绍


1.查询语言不同:hive是hql语言,mysql是sql语句;
 
2.数据存储位置不同:hive是把数据存储在hdfs上,而mysql数据是存储在自己的系统中;
 
3.数据格式:hive数据格式可以用户自定义,mysql有自己的系统定义格式;
 
4.数据更新:hive不支持数据更新,只可以读,不可以写,而sql支持数据更新;
 
5.索引:hive没有索引,因此查询数据的时候是通过mapreduce很暴力的把数据都查询一遍,也造成了hive查询数据速度很慢的原因,而mysql有索引;
 
6.延迟性:hive延迟性高,原因就是上边一点所说的,而mysql延迟性低;
 
7.数据规模:hive存储的数据量超级大,而mysql只是存储一些少量的业务数据;
 
8.底层执行原理:hive底层是用的mapreduce,而mysql是excutor执行器;
 

原文链接:https://blog.csdn.net/Sunshine_2211468152/article/details/83031356
 
 
 
 
apache hive 是构建在apache hadoop上的数据仓库,适合处理海量的离线数据。
 
hive的数据构成是由HDFS+元数据组成,而元数据表对hive极其重要。
 
先看下元数据表结构

 

 可以理解为通过元数据表可以找到HDFS

 


免责声明!

本站转载的文章为个人学习借鉴使用,本站对版权不负任何法律责任。如果侵犯了您的隐私权益,请联系本站邮箱yoyou2525@163.com删除。



 
粤ICP备18138465号  © 2018-2025 CODEPRJ.COM