kettle--變量的使用


一、kettle的inner join

需求:

目前本地文件系統上有一個person.csv文件:

數據庫中有一個person表:

現在需要將這兩張表做inner join的操作。

1.1首先我們寫一個轉換,這個轉換有兩個輸入,一個輸入是表輸入,一個是csv類型文件的輸入

首先是表輸入的配置:

為什么要排序呢,因為做inner join的時候,需要兩個輸入都是排過序的。

下面是csv輸入文件的配置:

1.2現在也需要對csv文件中的數據做排序:

1.3現在對排過序的輸入做inner join

1.4對join完成后的數據做文本文件的輸出

1.5運行這個轉換查看運行的結果

二、kettle執行的日志類別

當運行一個轉換或者job的時候,可以選擇日志的級別

日志級別的介紹:

Nothing 沒有日志 不顯示任何輸出
Error 錯誤日志 僅僅顯示錯誤信息
Minimal 最小日志 使用最小的日志
Basic 基本日志 缺省的日志級別
Detailed詳細日志 給出日志輸出的細節
Debug 調試日志 調試目的,調試輸出
Rowlevel行級日志 打印出每一行記錄的信息
默認為基本日志

三、變量

kettle中的變量分兩種:一種是屬性變量,一種是運行時參數變量

3.1設置變量

3.1.1設置屬性變量

設置屬性變量有以下兩種方式:

在$kettle_home/.kettle/kettle.properties里設置key=value

在spoon主界面點擊編輯--》編輯kettle.properties文件

3.1.2設置運行時變量

在job或者轉換的命名參數里設置參數的名稱和默認值,然后在運行job和轉換是要指定參數的值否則會使用默認的值

在spoon主界面點擊編輯--》設置環境變量

環境變量是在spoon運行時有效,軟件關閉重啟后清除

現在我們將數據庫的連接關鍵字設置為屬性變量

3.2使用變量

3.2.1屬性變量的使用

3.2.2使用運行時變量

 


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM