1. 兩者都可以用來存儲數據。Hadoop擅長於存儲各種格式的龐大的數據,任意的格式甚至非結構化的處理。而Hbase主要用來存儲結構化和半結構化的松散數據。
2.與Hadoop一樣,Hbase目標主要依靠橫向擴展,通過不斷增加廉價的商用服務器,來增加存儲和處理能力,例如,把集群從10個節點擴展到20個節點,存儲能力和處理能力都會加倍
3.從訪問角度來看,hadoop通過順序訪問數據,要查找數據必須搜索整個數據集,如果要進行隨機讀取數據,效率較低。
HBase能通過主鍵(row key)和主鍵的range來檢索數據,效率較高
4.HDFS是分布式文件系統,管理的是存放在多個硬盤上的數據文件,而Hbase管理的是類似於key—value映射的表。Hbase底層仍然依賴HDFS來作為其物理存儲,並且還需要Zookeeper協助提供部分配置服務,包括維護元信息和命名空間等