HBase出現的原因:
HBase作為面向列的數據庫運行在HDFS之上,HDFS缺乏隨即讀寫操作,HBase正是為此而出現。HBase以Google BigTable為藍本,以鍵值對的形式存儲。項目的目標就是快速在主機內數十億行數據中定位所需的數據並訪問它。
HBase是一個數據庫,一個NoSql的數據庫,像其他數據庫一樣提供隨即讀寫功能,Hadoop不能滿足實時需要,HBase正可以滿足。如果你需要實時訪問一些數據,就把它存入HBase。
你可以用Hadoop作為靜態數據倉庫,HBase作為數據存儲,放那些進行一些操作會改變的數據。
HBase:
HBase是一個管理系統,數據依然是存在HDFS中,但是HBase管理的數據具有自己的組織結構,能夠滿足我們快速查詢某一些數據的特點,而HDFS做不到。
HDFS和HBase如何用哪一個?
1.兩者可以配合使用,即數據可以存儲在HDFS中,同時也存儲在HBase中(兩者的數據可以稍有不同,比如一個數據比較全,另外一個根據需求,可以少一些),如果需要實時查詢某些數據時,使用HBase,進行Hive統計,或者MapReduce運算時,使用HDFS數據。
2.MapReduce的 輸入輸出,可以設置為HBase
mapreduce編程模型之hbase表作為數據源輸入輸出
http://blog.csdn.net/liuyuan185442111/article/details/45306193
2.Hive也可以對HBase進行操作。
http://www.cnblogs.com/npumenglei/p/how_to_use_hive_load_data_from_hbase.html
http://blog.csdn.net/itjavaer/article/details/47397307
http://blog.csdn.net/jiedushi/article/details/7325292