准備工作
系統環境:Windows10
Kettle是Java語言開發的,運行需要Java運行環境,如果還沒安裝JDK:點這里安裝jdk1.8
如果已經安裝jdk,直接進行下面的步驟。
1. 下載kettle8.2
下載文件名:pdi-ce-8.2.0.0-342.zip
下載地址
國內鏡像(下載快,推薦使用)
http://mirror.bit.edu.cn/pentaho/
或者
https://community.hitachivantara.com/s/article/data-integration-kettle
或者
https://sourceforge.net/projects/pentaho/files/Data%20Integration/
2.安裝kettle8.2
解壓kettle安裝包:pdi-ce-8.2.0.0-342.zip
設置KETTLE_HOME環境變量(當然不設置也可以使用,但開啟后不會自動生成.kettle目錄)
右鍵此電腦-->屬性-->高級系統設置-->環境變量-->系統環境變量下 點擊新建
設置KETTLE_HOME
變量值為data-integration目錄的路徑
進入data-intergration目錄,找到Spoon.bat文件,
修改
PENTAHO_DI_JAVA_OPTIONS="-Xms1024m"為PENTAHO_DI_JAVA_OPTIONS="-Xms512m"
修改后記得保存。
雙擊Spoon.bat啟動kettle
3.kettle初體驗
用kettle創建一個轉換,完成將一個excel內容復制到另一個excel中,
如下圖:
具體操作步驟如下:
3.1 新建一個轉換
使用Excel輸入
使用Excel輸出
效果如下:
連接Excel輸入和Excel輸出
點擊Excel輸入,按住Shift鍵不放,移動鼠標到Excel輸出,松開鼠標。
3.2. 准備輸入文件
input.xls表格內容如下:
3.3 設置輸入
雙擊Excel輸入進入編輯步驟
文件選項下,選擇表格類型,如果是.xls文件選擇Excel97-2003,如果是.xlsx文件選擇第則Excel 2007 XLSX(Apache POI)
點擊瀏覽,選擇輸入文件所在位置
點擊增加,可看到輸入文件input.xls被添加到選中的文件中。
選擇字段選項,點擊獲取來自頭部數據的字段,點擊確定
3.4 設置輸出
雙擊輸出
選擇文件選項,點擊瀏覽,選擇輸出到位置及輸出文件名(例如:保存到桌面,文件名為output.xls)
去掉擴展名里的內容
選擇字段選項,點擊獲取字段,設置Number類型的格式為0(不設置,默認輸出格式為0.00),點擊確定
3.5 保存轉換
點擊保存圖標保存
保存的文件名為:test.ktr, 后綴名.ktr中的k代表kettle,tr代表transformation
3.6 運行轉換
點擊運行圖標運行
點擊啟動
運行成功如下
可以點擊Preview data看某個步驟的輸出
例如:查看輸入步驟的Preview data,點擊Excel輸入,選擇Preview data
查看輸出步驟的Preview data方法同上。
查看輸出文件
output.xls內容如下:
內容與input.xls完全一致,說明該轉換正確。
完成! enjoy it!