今天先來做一個簡單的kettle的例子。
打開輸入,選擇CSV文件輸入。
雙擊CSV文件輸入圖標,可以看見如下:
步驟名稱:就是你這一步的名字,可以任意取,原則就是要明白,清楚這一步是做了什么操作。
文件名:是你要選取的這個.CSV結尾的文件的名稱。
列分隔符:每個CSV文件都是有一定的規則的,要么是分號是分隔符,要么是逗號是分隔符等等。
包含列頭行:這個是針對你的這個CSV是否具有表頭,如果有就勾上,否則他就把第一行的表頭當成數據導入了。
這樣選擇一個CSV格式的文件之后就可以了,接下來點擊一下獲取字段,得到如下圖所示:
點擊一下預覽,會提示要預覽的行數沒輸入你要預覽的行數就行了。
以上就是預覽的內容了。
之后點擊確定就OK了。
之后再來說說輸出的操作。
這次輸出的操作我們選擇的是MySQL數據庫,首先需要文件---->新建------->數據庫連接。
填寫上基本的數據庫信息就OK了,點擊測試出現
說明你的連庫信息是正確的,點擊確定就可以了。這一步的連接數據庫只是針對於這個裝換的。對於其他轉換我們需要重新制定數據庫!
雙擊表輸出:
數據庫連接就是我們剛才創建的數據庫連接,如果不是我們想要的,可以另外再創建一個連接。
目標數據庫如果沒有創建的話,我們可以先寫一個名字,然后再點擊SQL,就出現了一個執行創建的sql的界面:
里面有些字段的類型是可以改的,改成你需要的字段的類型。之后點擊執行就行了。這一次我們再查看一下我們數據庫里面的表,就有字段了。
下面我們點擊Run,
輸出日志如下:
步驟度量如下:
之前表里面有2823個數據,所以這一次執行成功了!
但是!!!
這里面有一個問題,我們可以再Run一下這個轉換,發現又導入了2823條記錄。再來看看數據庫里面的數據:
納尼,怎么是5646???
怎么解決???
這中間是需要一個過濾的操作的,基本的思想就是:ID一樣的就是Update,ID不一樣的就是插入就去就可以了。
這就需要另外一個輸出的功能了,就是插入/更新。
在這里面設置需要過濾的條件就可以了。
至此一個transformation就可以了。