DataStage常用Stage學習


  1. DataStage EE的開發主要由DataStage Designer完成,DataStage的基本邏輯處理單位是Job,每個Job由許多Stage組成;由Stage來完成對數據的抽取,轉換,加載等。
  2. Sequential File Stage

    • 功能特點:適用於一般順序文件(定長或不定長),可識別文本文件或IBM大機ebcdic文件。

    • 在general說明此文件內容,格式,存儲目錄等                                                                                         

    • 修改文件屬性,文件名稱,reject方式等到

       

    • 修改文件格式,比如記錄結束符是什么,字段分隔符,字符串是用什么區別等

    • 輸入此文件字段內容                                                                           
  3. Annotation

    功能特點:一般用於注釋,可利用其背景顏色在job中分顏色區別不同功能塊                    

  4. Column Export Stage

    • Stage類型:Restructure Stage
    • 功能說明: 與Column Import Stage相反,將多個類型不同的字段合並成一個string或者binary類型的字段。

     

    • 具體用法:

    Stage Page:關鍵是properties的配置,選擇將哪些字段合並,合並后的新字段在Output下的column中直接定義。

     

    。 Inputs Page:對輸入數據字段的描述,這里關鍵是Format的配置,決定合並后的字段的格式

     

    。 Oupputs Page:對最終合並后的輸出數據字段的描述

    。經過stage的前后數據的對比                                                                            

    合並字段后:                                                                                                                      

     

     


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM