Kettl:Kettle is an acronym for "Kettle E.T.T.L.Emvironment". This means it has been designed to help you with your ETTL needs: the Extraction, Transformation, Transformation and Loading of data.
Pentaho Data Integration(Kettle) 是一款開源的ETL(Extract Transformation Load)工具,用來完成數據的抽取,清洗、轉換和加載等數據處理方面的工作。
特點:
流程式設計方便易用
全面的數據訪問支持
支持多平台
插件架構擴展性好
商業/社區支持
多種方式應用集成
全面優化高效穩定
Kettle vs Informatica:
相似點:
•Pentaho 和 Informatica 都提供了大量的轉換步驟、腳本功能,都 可以處理復雜的ETL 轉換。
•通常情況下 Informatica 比 Kettle 更快。Informatica 有下推優化, 緩存查詢等提高性能的手段。但是如果你對 Kettle 和數據庫有足夠 的了解,做一些調整,你可以提高 Kettle 的速度,在一些情況下可 以達到甚至超過 Informatica 的速度。 Kettle 的優點:
•Kettle 的易用性比 Informatica 好,需要的培訓要少很多。
•Kettle 不需要像 Informatica 那樣大的前期投入。
•Kettle 的插件架構支持快速定制開發
Informatica 的優點:
•Informatica 的錯誤報告功能比 Kettle 更友好,更容易定位錯誤。 Kettle 通常只把異常拋出,需要實施人員有更豐富的經驗。
•Informatica 比 Kettle 有更好的監控工具和負載均衡等企業級應用 功能,更適合大規模的ETL 應用。。