kettle組件-轉換


1:列轉行
2:列轉行
3:去除重復記錄
      步驟名稱:保持唯一性
      增加計數器到輸出?:當勾選了此項,並在計數器字段后給予了名稱,則將會在該字段下顯示去掉的重復行數。
      字段名稱:用來去重的字段,可選多個字段,表示多個字段都相同時表示重復。
      該功能類似與sql中的distinct關鍵字。
4:增加序列
      一個序列是在某個起始值和增量的基礎之上,經常改變的整數值。可以使用數據庫定義好的序列,也可以使用kettle決定的序列。
      kettle序列在同一個轉換中是唯一使用的,每一次轉換運行的時候,序列的值又會重新循環一次,從開始值開始。
      使用數據庫序列:
   連接名稱:選擇數據庫存在的連接名稱。
      序列名稱:數據庫序列的名稱。
      使用計數器來計算序列:如果想用kettle生成的序列,使用此項。
      計數器名稱(可選):如果一個轉換中多個步驟生成同樣的值名稱,這個選項允許你指定計數器名稱,避免按照先后順序通過多個步驟。
      起始值:序列的起始值。
      增量:序列的步長。
      最大值:序列的最大值。
5:字段選擇
      字段選擇中包含有三個頁簽:選擇和修改,移除,元數據
      選擇和修改:用於獲取字段名稱,並可以對名稱進行修改,還可以修改其長度和精度。
      移除:移除字段后該字段將不會被預覽查看到。
      元數據:可以修改字段名稱,以及數據類型,長度,精度,格式等信息。但是,當在選擇和修改中將某一字段的名稱修改,要想
                     在元數據中繼續修改則選擇修改前的原字段名稱,會提示找不到該字段,需要選擇在選擇修改頁簽中已經修改成的名稱。
6:字符串替換
      將某個字段的某些字符替換成我們給定的字符。
      首先選擇輸入流字段,
      “輸出流字段”自己命名(就是用來保存處理后的結果的字段,可以和輸入流字段保持一致),可以選擇正則表達式,
      “搜索”就是你希望被替換的字符,字符串,可以是一個正則表達式,
      “使用…替換”就是你期望用什么值替換被替換的部分,
      “設置為空串”就是將你被選擇的部分用空替換
      “使用字段值替換”你可以使用現有的某個字段的值替換你期望被替換的部分,后面兩個根據自己的需要進行選擇。
 案例:
     1:轉換/輸入/生成記錄-------自定義字段,類型,對應的值,生成記錄可以按照指定的生成記錄數生成值。
     2:轉換/轉換/字符串轉換-----各種定義
 總:a:輸入流字段----要被替換的字段的名稱
        b: 輸出流字段----替換后的新字段的名稱
        c:  搜索-----------表示要被替換的字符或字符串
        d: 使用…替換----被替換的字符或字符串要被替換為
        e: 輸出流字段為空-----此時替換將在原字段做改變
        f: 搜索為空------------每個字符前后都會視為空,為空的位置都會插入被替換字符或字符串
        g: 使用…替換為空-----搜索字符將會置空
        h: 熟悉kettle中的正則表達式
A:kettle中的正則表達式
     1:正則表達式僅用字符或者字符串表示-----包含該字符或者字符串的字符串都會被查詢出來
     2:正則表達式中含有句點符號--------------句點符號可以匹配所有字符,包括空格和非字符符號
例如:t.n----匹配tan,ton,tmojn,tn
     3:正則表達式中包含方括號----------------只有包含中括號中的字符才能被匹配,方括號只允許匹配單個字符
例如t[asdf]n----匹配tan,tsn,tdn
     4: 使用圓括號加/的方式匹配單個或多個字符-----例如:t(a/s/d/f/oo)n----此時toon就會被匹配上
     5:表示匹配次數的符號,這些符號用於確定僅靠該符號左邊的符號出現的次數
     *表示0次或多次
     +表示1次或多次
     ?表示0次或1次
     {n}表示恰好n次
     {n,m}表示n次到m次
     6:正則表達式中的連字符“-”表示一個范圍
     7:”^“表示否的意思,表示不匹配該字符
7:將字段值設置為常量
      字段:獲取字段名稱
      值替換:用常量值代替原值,此時無論原值有多少行,該行的所有值都會被一個值所替換。
      轉換掩碼:用於設置日期類型的格式。
      設為空串:若設為空串則該列值全顯示為空。
8:拆分字段
      需要拆分的字段:選擇需要拆分的字段
      分隔符:拆分字段間的結束符號
      新的字段:看看能拆分的最大數,依據最大數量來定需要設置的新字段的數量,也可往大的設置,截取不到將輸出NULL,也可以往
      小的設置,這樣的話值部分截取不到。
 
 
 


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM