大數據查詢引擎的選型,畫了幾張架構圖,和一些對比分析:
一、Presto
二、Impala
三、HAWQ
四、總體比較:
1)都是MPP架構,且沒有明顯性能差距
2)HAWQ的功能、特性較Presto和Impala更全面,同時帶來系統配置復雜,學習維護成本高的風險
3)Presto與Impala都有各自明顯的優勢:
1,Presto可以通過Connector接入多種數據源,靈活性高,而Impala只支持有限的數據源類型
2,Impala天然支持Coordinator高可用,Presto的Coordinator存在單點故障,需人工參與恢復
3,Impala更容易在現有CDH環境部署、集成
目前使用Hive痛點問題是慢
在滿足速度快的條件下,替代方案的穩定性、易用性、易維護性優先考慮,