一、概述
轉換步驟分類:
1. 增加新的列
2. 字符串處理
3. 行列變換
4. 排序/排重/字段選擇
5. 其他轉換步驟
二、增加新的列
1.增加常量列
增加一列常量的列
其它增加列的操作大同小異,不一一贅述,只介紹計算器
1. 增加常量列 2. 增加序列列 3. 增加分組序列列 4. 增加校驗列 5. 增加XML 列 6. 計算器
2.計算器
可以進行數值運算、日期運算等...
更多計算類型的介紹,參見wiki
三、字符串處理
1.字符串拆分
1.同Java的indexOf,左閉右開的形式
2.將一個字段拆分為多個字段,注意配置拆分后接收的字段
3.拆分成多行
類似上面,不過拆分成多行是這樣的結果:
2.字符串合並
3.字符串替換
值映射:對數值進行映射,例如經典的性別1 0映射為男 女:
正則匹配:
4.字符串其它轉換
字符串操作:
可以進行字符串轉義(例如> 轉義為 >)、保留/去除字符串里的數字、移除特殊字符、補充長度
四、行列變換
圖示如下:(也叫正規化-列轉行-寬表變窄表/ 反正規化-行轉列-窄表變寬表)
示例如下:
窄表變寬表的配置:注意理解分組字段的含義
行轉列,參考:https://www.cnblogs.com/OliverQin/p/5871330.html
五、排序/去重/字段選擇
1.排序
2.排重
Unique Row: 需要事先排序:
Unique Row(Hash): 不排序,速度快,占內存。