Druid和Spark對比
不是Spark專家, 如果描繪有錯誤, 請通過郵件列表或者其他方式告知我們
Spark實現彈性的分布式數據集概念的計算集群系統, 可以看做商業分析平台。 RDDs能復用持久化到內存中的數據, 從而為迭代算法提供更快的計算速度。 這對一些工作流例如機器學習格外有用, 有些操作需要重復執行很多次才能達到結果的最終收斂。 Spark 提供了大量的算法用來查詢和分析大量數據.
Druid 被設計成增強的分析應用, 重點關注注入數據和查詢數據的延時問題。 如果你開發了WEB界面用於任意維度的探索查詢數據, 會發現交互式查詢Spark可能很慢。