hive和關系型數據庫


      1)hive和關系型數據庫存儲文件的系統不同。  hive使用hdfs(hadoop的分布式文件系統),關系型數據庫則是服務器本地的文件系統;


       2)hive使用的計算模型是mapreduce,而關系型數據庫則是自己設計的計算模型。


       3)hive是為海量數據做數據挖掘設計的,實時性差;而關系型數據庫是為實時查詢的業務進行設計的。


       4)hive很容易擴展自己的存儲能力和計算能力,這個是繼承hadoop的,而關系型數據庫在這方面相對較差。而數據庫由於 acid 語義的嚴格限制,擴展行非常有限。

 

       5)hive中不支持對某個具體行的操作,對數據的操作只支持覆蓋原數據和追加數據;hive也不支持事務和索引。 ---------已經都支持了吧


       6)hive在加載數據時候和關系數據庫不同。

    hive:檢查數據格式的操作是在查詢操作時候執行,這種模式叫“讀時模式"

    關系數據庫:“寫時模式”,數據加載時候對數據模式進行檢查校驗的操作。

    當我們的數據是非結構化,存儲模式也是未知時候,關系數據操作這種場景就麻煩多了,這時候hive就會發揮它的優勢。


       7)執行延遲。

    在利用 mapreduce 執行 hive 查詢時,也會有較高的延遲。相對的,數據庫的執行延遲較低。
          


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM