MPP數據庫
版權聲明:本文為博主原創文章,轉載請注明出處。 https://blog.csdn.net/lyc417356935/article/details/45033069
MPP數據庫定義
MPP即大規模並行處理(Massively Parallel Processor )。 在數據庫非共享集群中,每個節點都有獨立的磁盤存儲系統和內存系統,業務數據根據數據庫模型和應用特點划分到各個節點上,每台數據節點通過專用網絡或者商業通用網絡互相連接,彼此協同計算,作為整體提供數據 庫服務。非共享數據庫集群有完全的可伸縮性、高可用、高性能、優秀的性價比、資源共享等優勢。
大規模並行處理(MPP)架構
Vertica無共享MPP的特點
- 無特殊節點
- 所有節點對等
- 可通過任意節點查詢或加載數據
- 實時加載與查詢同步進行
目前常見的MPP架構數據庫
1.GREENPLUM
2.DB2 DPF架構數據庫
3.vertica mpp數據庫
為什么選擇MPP
• PB級別的分析需求
- 傳統數據庫無法支持大規模集群與PB級別數據量
- 性能受限
- 擴展性受限
- 成本高昂
• 軟硬件一體機成本高昂、擴展受限
- 生產擴容、測試、開發、容災都需新購同型號一體機(機櫃)
- 跨代兼容性問題
• In-memory技術太貴而且不成熟
- 內存成本高
- TB級別以下,不適合大數據量
• Hadoop技術的先天不足
- Hive等sql-on-hadoop性能太慢
- SQL兼容性與支持不足
- 數據安全性無法保證
大數據之惑,面對越來越龐大的數據,企業如何利用好大數據值得思考,HADOOP,MPP,PPT在精彩,還是一步步的轉變。