pentaho之kettle篇---kettle基本操作


 

 

 

 

今天先來做一個簡單的kettle的例子。

打開輸入,選擇CSV文件輸入。

雙擊CSV文件輸入圖標,可以看見如下:

步驟名稱:就是你這一步的名字,可以任意取,原則就是要明白,清楚這一步是做了什么操作。

文件名:是你要選取的這個.CSV結尾的文件的名稱。

列分隔符:每個CSV文件都是有一定的規則的,要么是分號是分隔符,要么是逗號是分隔符等等。

包含列頭行:這個是針對你的這個CSV是否具有表頭,如果有就勾上,否則他就把第一行的表頭當成數據導入了。

這樣選擇一個CSV格式的文件之后就可以了,接下來點擊一下獲取字段,得到如下圖所示:

點擊一下預覽,會提示要預覽的行數沒輸入你要預覽的行數就行了。

以上就是預覽的內容了。

之后點擊確定就OK了。

之后再來說說輸出的操作。

這次輸出的操作我們選擇的是MySQL數據庫,首先需要文件---->新建------->數據庫連接。

 

 填寫上基本的數據庫信息就OK了,點擊測試出現

說明你的連庫信息是正確的,點擊確定就可以了。這一步的連接數據庫只是針對於這個裝換的。對於其他轉換我們需要重新制定數據庫!

 雙擊表輸出:

數據庫連接就是我們剛才創建的數據庫連接,如果不是我們想要的,可以另外再創建一個連接。

目標數據庫如果沒有創建的話,我們可以先寫一個名字,然后再點擊SQL,就出現了一個執行創建的sql的界面:

里面有些字段的類型是可以改的,改成你需要的字段的類型。之后點擊執行就行了。這一次我們再查看一下我們數據庫里面的表,就有字段了。

下面我們點擊Run,

輸出日志如下:

步驟度量如下:

之前表里面有2823個數據,所以這一次執行成功了!

但是!!!

這里面有一個問題,我們可以再Run一下這個轉換,發現又導入了2823條記錄。再來看看數據庫里面的數據:

納尼,怎么是5646???

怎么解決???

這中間是需要一個過濾的操作的,基本的思想就是:ID一樣的就是Update,ID不一樣的就是插入就去就可以了。

這就需要另外一個輸出的功能了,就是插入/更新。

在這里面設置需要過濾的條件就可以了。

至此一個transformation就可以了。

 


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM