Kettle簡介:Kettle 是 PDI 以前的名稱,PDI 的全稱是Pentaho Data Integeration,Kettle 本意是水壺的意思,表達了數據流的含義。Kettle是一款國外開源的ETL工具,純java編寫,可以在Window、Linux、Unix上運行,綠色無需安裝,數據抽取高效穩定。Kettle這個ETL工具集,它允許你管理來自不同數據庫的數據,通過提供一個圖形化的用戶環境來描述你想做什么,而不是你想怎么做。Kettle中有兩種腳本文件,transformation和job,transformation完成針對數據的基礎轉換,job則完成整個工作流的控制。作為Pentaho的一個重要組成部分,現在在國內項目應用上逐漸增多。
Kettle下載和安裝:
1、官網各個版本下載地址:https://sourceforge.net/projects/pentaho/files/Data%20Integration/
2、Kettle是純JAVA編程的開源軟件,本地環境配置JDK1.7以上即可運行,解壓后直接使用無需安裝。
需准備的其他東西:
數據庫驅動,如筆者連接的是mysql則需將mysql的驅動放在kettle根目錄的bin下面,然后到服務中啟動mysql,重啟kettle。
教程步驟:
1、運行spoon.bat,打開spoon圖形工具
kettle解壓包目錄

啟動spoon.bat

kettle打開頁面![]()
注意:紅圈處沒有connect按鈕,原因為資源庫配置文件亂碼造成
解決方法:打開系統盤用戶目錄下的repositories.xml配置文件,將亂碼內容刪除,並刪除.spoonrc文件,重啟kettle

2、創建或連接資源庫
選擇創建數據庫資源庫
創建資源庫

選擇創建數據庫資源庫
輸入資源庫名稱(自定義) 點擊Database Connection創建數據庫連接

選擇Create New Connection
3、創建數據庫連接
輸入連接名稱、選擇類型(根據自身所需選擇,這里連接的是mysql數據庫,如連接其他數據庫,需將數據庫驅動放在kettle根目錄中的lib下面,然后啟動數據庫重啟kettle)
確認輸入無誤后點擊測試,測試是否連接成功,失敗多為lib下找不到數據庫驅動

選擇finish
創建成功,選擇Connect連接到數據庫
登陸,默認有個admin用戶,密碼也為admin啟動后可以修改用戶密碼或添加其他用戶

創建成功
連接數據庫查看可以發現該數據庫自動創建了使用kettle所需要的表結構
更新一、如何添加新用戶
點擊工具=》資源庫=》探索資源
選擇【安全】=》添加用戶=》填寫賬號密碼保存
