1)hive和關系型數據庫存儲文件的系統不同。 hive使用hdfs(hadoop的分布式文件系統),關系型數據庫則是服務器本地的文件系統;
2)hive使用的計算模型是mapreduce,而關系型數據庫則是自己設計的計算模型。
3)hive是為海量數據做數據挖掘設計的,實時性差;而關系型數據庫是為實時查詢的業務進行設計的。
4)hive很容易擴展自己的存儲能力和計算能力,這個是繼承hadoop的,而關系型數據庫在這方面相對較差。而數據庫由於 acid 語義的嚴格限制,擴展行非常有限。
5)hive中不支持對某個具體行的操作,對數據的操作只支持覆蓋原數據和追加數據;hive也不支持事務和索引。 ---------已經都支持了吧
6)hive在加載數據時候和關系數據庫不同。
hive:檢查數據格式的操作是在查詢操作時候執行,這種模式叫“讀時模式"
關系數據庫:“寫時模式”,數據加載時候對數據模式進行檢查校驗的操作。
當我們的數據是非結構化,存儲模式也是未知時候,關系數據操作這種場景就麻煩多了,這時候hive就會發揮它的優勢。
7)執行延遲。
在利用 mapreduce 執行 hive 查詢時,也會有較高的延遲。相對的,數據庫的執行延遲較低。
