Kettle 是 PDI 以前的名稱,PDI 的全稱是Pentaho Data Integeration
Kettle是ETL中的一個開源工具,Java開發
https://github.com/pentaho/pentaho-kettle
ETL是EXTRACT(抽取)、TRANSFORM(轉換)、LOAD(加載)
Kettle的主要工具:
Spoon:
圖形化工具,用於快速設計和維護復雜的ETL工作流
Pan:
用來執行轉換
Kitchen:
用來執行作業
Kettle中有兩種腳本文件
transformation完成針對數據的基礎轉換
job則完成整個工作流的控制
下載pdi-ce-9.0.0.0-423.zip版本,解壓
雙擊Spoon.bat
轉換eg:
1.創建轉換
雙擊轉換
2.數據庫連接
雙擊DB,設置連接信息
3.核心對象
將表輸入和表輸出拖拽到右側轉換窗口
編輯表輸入
將兩個操作進行連接:按shift+指針從表輸入拖拽至表輸出
編輯表輸出
保存當前轉化
執行轉換
數據從localTest指定的庫sys_user到了localTest1指定庫的user表
注:
在Kettle中,數據的單位是行,數據流就是數據行從一個步驟到另一個步驟的移動