kettle——入門操作(行扁平化)


行扁平化,多行記錄只有一個字段不同時,將不同字段轉變為列。如下,最后解釋一下原理及設計不足之處。

第一種情況,數據特點,flag為a的有兩行,flag為b的有三行

      

    行扁平化設置,扁平化后的目標字段,輸入流中Grid Data 中flag為b的有三個:1,2,3,所以我們在這里也需要設計三列

      

    看最后excel結果,what,怎么只有b了?

      

        What?和預想的不一樣啊!!!!!

第二種情況,這次數據比較規范,a,b都只有兩行。

      

    看行扁平化控件設置如下,我們設置的扁平化的目標字段也有兩個,type1和type2

      

     看最后Excel輸出結果,

      

    這次結果對了,看下面的。

第三種情況,數據和第二種情況一樣,

      

    行扁平化控件設置,如下,此處和第一種情況一樣。

      

    看Excel輸出結果,

      

    這什么情況?a呢?

 

 總結:此控件只能滿足相同數據行(一列不同)數據一樣的情況,一旦出現不一樣的情況將不再適用。

      控件在輸入流統計數量的時候,以控件增加的列為統計重復次數。且把統計的最后一行作為重復記錄輸出,這就是為什么1,3出現b而缺少a的原因。

 


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM