[Hadoop大數據]——Hive初識

本文轉載自查看原文 2016-08-13 13:13 5084 數據倉庫/ Hadoop

Hive出現的背景

Hadoop提供了大數據的通用解決方案，比如存儲提供了Hdfs，計算提供了MapReduce思想。但是想要寫出MapReduce算法還是比較繁瑣的，對於開發者來說，需要了解底層的hadoop api。如果不是開發者想要使用mapreduce就會很困難....

另一方面，大部分的開發者都有使用SQL的經驗。SQL成為開發者必備的技能...

那么可以不可以使用SQL來完成MapReduce的過程呢？—— 答案就是，Hive

Hive可以幫助開發者從現有的數據基礎架構轉移到Hadoop上，而這個基礎架構是基於傳統關系型數據庫和SQL的。Hive提供了Hive查詢語言，即HQL，它可以使用SQL方言查詢存儲在hadoop中的數據。

Hive本身不會生成java的mapreduce程序，而是通過XML文件驅動執行內置的、原生的Mapper和Reducer。

如果想要基於SQL還想具有上面的特性，可以直接使用hadoop提供的nosql數據庫——HBase

Hive適合做數據倉庫應用程序，可以維護海量數據，對數據進行挖掘，形成意見和報表。

同類型的工具就是Pig

本站轉載的文章為個人學習借鑒使用，本站對版權不負任何法律責任。如果侵犯了您的隱私權益，請聯系本站郵箱yoyou2525@163.com刪除。

猜您在找 Hadoop（一）之初識大數據與Hadoop 初識大數據（三. Hadoop與MPP數據倉庫） 0基礎搭建Hadoop大數據處理-初識 [Hadoop大數據]——Hive數據的導入導出大數據Hadoop之——數據倉庫Hive [Hadoop大數據]——Hive部署入門教程 [Hadoop大數據]——Hive連接JOIN用例詳解大數據Hadoop生態圈：Pig和Hive 大數據利器Hive 大數據篇：Hive