kettle學習筆記(六)——kettle轉換步驟


一、概述

  轉換步驟分類:

    1. 增加新的列

    2. 字符串處理

    3. 行列變換

    4. 排序/排重/字段選擇

    5. 其他轉換步驟

二、增加新的列

  1.增加常量列

    增加一列常量的列

    

  其它增加列的操作大同小異,不一一贅述,只介紹計算器

       1. 增加常量列   2. 增加序列列   3. 增加分組序列列   4. 增加校驗列 5. 增加XML 列 6. 計算器 

  2.計算器

    可以進行數值運算、日期運算等...

    

  更多計算類型的介紹,參見wiki

三、字符串處理

  1.字符串拆分

    

    1.同Java的indexOf,左閉右開的形式

    2.將一個字段拆分為多個字段,注意配置拆分后接收的字段

    

    3.拆分成多行

      類似上面,不過拆分成多行是這樣的結果:

      

  2.字符串合並

    

  3.字符串替換

    

    值映射:對數值進行映射,例如經典的性別1 0映射為男 女:

    

    正則匹配:

    

  4.字符串其它轉換

    

    字符串操作:

      可以進行字符串轉義(例如> 轉義為 &gt)、保留/去除字符串里的數字、移除特殊字符、補充長度

四、行列變換

  圖示如下:(也叫正規化-列轉行-寬表變窄表/        反正規化-行轉列-窄表變寬表)

  

  示例如下:

    

  窄表變寬表的配置:注意理解分組字段的含義

    

  行轉列,參考https://www.cnblogs.com/OliverQin/p/5871330.html

五、排序/去重/字段選擇

  1.排序

    

  2.排重

    Unique Row: 需要事先排序:

    

 

    Unique Row(Hash): 不排序,速度快,占內存。


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM