數據倉庫和Hadoop大數據平台有什么差別?


 

廣義上來說,Hadoop大數據平台也可以看做是新一代的數據倉庫系統, 它也具有很多現代數據倉庫的特征,也被企業所廣泛使用。因為MPP架構的可擴展性,基於MPP的數據倉庫系統有時候也被划分到大數據平台類產品。

但是數據倉庫和Hadoop平台還是有很多顯著的不同。針對不同的使用場景其發揮的作用和給用戶帶來的體驗也不經相同。用戶可以根據下表簡單判斷什么場景更適合用什么樣的產品。

 數據倉庫和Hadoop大數據平台特性比較

特性

Hadoop

Data Warehouse

計算節點數

可到數千個

一般在128個以內

數據量

支持大於10PB

一般不大於5PB

數據類型

關系型,半關系型,無結構化,語音,圖像,視頻

關系型

時延

中/高

應用生態

創新型/人工智能

傳統數據庫型/BI類

應用開發接口

SQL,MR,豐富的編程語言接口

標准數據庫SQL

可擴展性

無窮的可能,完整的編程接口

有限擴展能力,主要通過UDF支持

事務支持

有限

完整

數據倉庫和Hadoop平台互為補充,立足於滿足客戶在不同使用場景下的業務需求。公有雲數據倉庫服務DWS能夠無縫地接入到公有雲Hadoop平台MRS服務上,支持SQL-over-Hadoop的這個特性,提供跨平台, 跨服務的數據共享。讓用戶在充分享受Hadoop帶來的開放,便捷,創新的同時,繼續使用熟悉的數據(倉)庫方式管理和使用自己的海量數據。繼續使用傳統的數據倉庫的上層應用,特別是商業智能BI類的應用。


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM