廣義上來說,Hadoop大數據平台也可以看做是新一代的數據倉庫系統, 它也具有很多現代數據倉庫的特征,也被企業所廣泛使用。因為MPP架構的可擴展性,基於MPP的數據倉庫系統有時候也被划分到大數據平台類產品。
但是數據倉庫和Hadoop平台還是有很多顯著的不同。針對不同的使用場景其發揮的作用和給用戶帶來的體驗也不經相同。用戶可以根據下表簡單判斷什么場景更適合用什么樣的產品。
特性 |
Hadoop |
Data Warehouse |
計算節點數 |
可到數千個 |
一般在128個以內 |
數據量 |
支持大於10PB |
一般不大於5PB |
數據類型 |
關系型,半關系型,無結構化,語音,圖像,視頻 |
關系型 |
時延 |
中/高 |
低 |
應用生態 |
創新型/人工智能 |
傳統數據庫型/BI類 |
應用開發接口 |
SQL,MR,豐富的編程語言接口 |
標准數據庫SQL |
可擴展性 |
無窮的可能,完整的編程接口 |
有限擴展能力,主要通過UDF支持 |
事務支持 |
有限 |
完整 |
數據倉庫和Hadoop平台互為補充,立足於滿足客戶在不同使用場景下的業務需求。公有雲數據倉庫服務DWS能夠無縫地接入到公有雲Hadoop平台MRS服務上,支持SQL-over-Hadoop的這個特性,提供跨平台, 跨服務的數據共享。讓用戶在充分享受Hadoop帶來的開放,便捷,創新的同時,繼續使用熟悉的數據(倉)庫方式管理和使用自己的海量數據。繼續使用傳統的數據倉庫的上層應用,特別是商業智能BI類的應用。