Kettle 執行SQL腳本


以下操作都在5.0.1版本下進行開發,其余版本可以進行自動比對

本文將對Kettle5中常用步驟字段選擇(又名選擇/改名值,英文原名:Select Values)進行詳細解釋。這個步驟的功能非常強大,主要包括:
選擇:選擇的字段將按照你指定的順序加入到輸出流中,其他字段一概丟棄。除非你選中包含未選擇的列(圖1中的第2個控件);
刪除:需要從輸入流中丟棄的字段;
元數據:需要改變的元數據,包括字段的名稱、類型、長度、精度、格式等。

步驟初始化時,需要准備元數據,其順序是選擇、刪除、元數據,主要處理流程如下:
從輸入流中清空元數據集合;
按順序加入“選擇”中設置的字段,包括重命名、修改長度與精度等。如果選中“包含未選擇的列”,那么把其他字段按照名字排序,依次加入元數據中;
從已有元數據中刪除用戶設置的“移除”字段集合;
從已有元數據中按照“元數據”設置進行修改。
了解上述處理順序,才不會被一些奇怪的現象弄糊塗。

二、說明
1、步驟的屬性對話框如下圖1-3所示:
圖1.

圖2.

圖3.

2、下面通過一個表格逐項解釋每一個對話框中字段的含義。
序號
名稱
含義
1
選擇和修改
一共包含4個列,本標簽實際上決定了輸出行集的最大字段集合。也就是說,最終輸出的列不會超過這個集合。4個列解釋如下:
字段名稱:輸入行集的字段名稱
改名成:新的字段名稱
長度:新的字段長度
精度:新的字段精度
2
包含未指定的列,按名稱排序
如果選中,那么未在第1步中選擇的輸入行集其他列將自動加入到本步驟元數據中。否則,只包含第1步中配置的列。
3
移除的字段
在第12步確定的字段集合基礎上,刪除所有配置的字段。
4
需要改變元數據的字段。
在第123步確定的字段集合基礎上,改變字段元數據。一共包含15個列,主要列解釋如下:
字段名稱:輸入行集的字段名稱
改名成:新的字段名稱
類型:新的字段類型
長度:新的字段長度
精度:新的字段精度
Binary to Normal:采用二進制或者原始類型存儲
格式:格式化字符串時需要。例如需要格式化日期,那么可以用yyyy-MM-dd'T'HH:mm:ss.XXX,注意其中單引號限定部分。如果需要在日期格式中使用原始字母,那么必須用單引號限定,否則將當成表達式解析。
Date format Lenient:在解析日期異常數據時是否支持寬容模式。例如碰到15月,如果啟用寬容模式,那么15月會當成15-12=3月。

三、附錄
主要代碼解釋如下:
包:org.pentaho.di.trans.steps.selectvalues
元數據類:SelectValuesMeta
運行數據類:SelectValuesData
執行過程類:SelectValues
元數據配置類:SelectMetadataChange

簡單的操作步驟已經講解完畢,接下來給大家帶來具體的單表操作。
更多知識資源分享,歡迎關注公眾號《大喇叭玩轉數據庫》


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM