DataStage常用Stage学习


  1. DataStage EE的开发主要由DataStage Designer完成,DataStage的基本逻辑处理单位是Job,每个Job由许多Stage组成;由Stage来完成对数据的抽取,转换,加载等。
  2. Sequential File Stage

    • 功能特点:适用于一般顺序文件(定长或不定长),可识别文本文件或IBM大机ebcdic文件。

    • 在general说明此文件内容,格式,存储目录等                                                                                         

    • 修改文件属性,文件名称,reject方式等到

       

    • 修改文件格式,比如记录结束符是什么,字段分隔符,字符串是用什么区别等

    • 输入此文件字段内容                                                                           
  3. Annotation

    功能特点:一般用于注释,可利用其背景颜色在job中分颜色区别不同功能块                    

  4. Column Export Stage

    • Stage类型:Restructure Stage
    • 功能说明: 与Column Import Stage相反,将多个类型不同的字段合并成一个string或者binary类型的字段。

     

    • 具体用法:

    Stage Page:关键是properties的配置,选择将哪些字段合并,合并后的新字段在Output下的column中直接定义。

     

    。 Inputs Page:对输入数据字段的描述,这里关键是Format的配置,决定合并后的字段的格式

     

    。 Oupputs Page:对最终合并后的输出数据字段的描述

    。经过stage的前后数据的对比                                                                            

    合并字段后:                                                                                                                      

     

     


免责声明!

本站转载的文章为个人学习借鉴使用,本站对版权不负任何法律责任。如果侵犯了您的隐私权益,请联系本站邮箱yoyou2525@163.com删除。



 
粤ICP备18138465号  © 2018-2025 CODEPRJ.COM