一、概述
1.kettle是什么
Kettle是一款國外開源的ETL工具,純java編寫,可以在Window、Linux、Unix上運行,綠色無需安裝,數據抽取高效穩定。中文名稱叫水壺,該項目的主程序員MATT 希望把各種數據放到一個壺里,然后以一種指定的格式流出。
更多介紹,參考kettle中文網:http://www.kettle.net.cn/
強烈推薦書籍:《Pentaho Kettle解決方案:使用PDI構建開源ETL解決方案Matt》
2.kettle四大家族
Chef(中文:廚師)、Kitchen(中文:廚房)、Spoon(中文:勺子)、Pan(中文:平底鍋)---注意英文發
Chef—工作(job)設計工具 (GUI方式)
Kitchen—工作(job)執行器 (命令行方式)
Spoon—轉換(transform)設計工具 (GUI方式)
Span—轉換(transform)執行器 (命令行方式)
二、安裝與配置
1.前置條件
JDK1.5+
2.下載
Data Integration (or Kettle) 7.1版本下載:https://sourceforge.net/projects/pentaho/files/Data%20Integration/7.1/pdi-ce-7.1.0.0-12.zip/download。
其他版本可以通過在下載頁選擇
3.安裝
因Kettle是開源工具,下載的壓縮包直接解壓到本地路徑即可。
4.啟動
由於是WIN平台,雙擊 Spoon.bat:
啟動畫面:
啟動完成:
三、常見問題
說明JDK版本與kettle版本不匹配(這里7.0匹配1.8的版本)