一、kettle的inner join
需求:
目前本地文件系統上有一個person.csv文件:

數據庫中有一個person表:

現在需要將這兩張表做inner join的操作。
1.1首先我們寫一個轉換,這個轉換有兩個輸入,一個輸入是表輸入,一個是csv類型文件的輸入
首先是表輸入的配置:

為什么要排序呢,因為做inner join的時候,需要兩個輸入都是排過序的。
下面是csv輸入文件的配置:

1.2現在也需要對csv文件中的數據做排序:

1.3現在對排過序的輸入做inner join

1.4對join完成后的數據做文本文件的輸出
1.5運行這個轉換查看運行的結果
二、kettle執行的日志類別
當運行一個轉換或者job的時候,可以選擇日志的級別

日志級別的介紹:
Nothing 沒有日志 不顯示任何輸出
Error 錯誤日志 僅僅顯示錯誤信息
Minimal 最小日志 使用最小的日志
Basic 基本日志 缺省的日志級別
Detailed詳細日志 給出日志輸出的細節
Debug 調試日志 調試目的,調試輸出
Rowlevel行級日志 打印出每一行記錄的信息
默認為基本日志
三、變量
kettle中的變量分兩種:一種是屬性變量,一種是運行時參數變量
3.1設置變量
3.1.1設置屬性變量
設置屬性變量有以下兩種方式:
在$kettle_home/.kettle/kettle.properties里設置key=value
在spoon主界面點擊編輯--》編輯kettle.properties文件
3.1.2設置運行時變量
在job或者轉換的命名參數里設置參數的名稱和默認值,然后在運行job和轉換是要指定參數的值否則會使用默認的值
在spoon主界面點擊編輯--》設置環境變量
環境變量是在spoon運行時有效,軟件關閉重啟后清除
現在我們將數據庫的連接關鍵字設置為屬性變量

3.2使用變量
3.2.1屬性變量的使用

3.2.2使用運行時變量


