- DataStage EE的开发主要由DataStage Designer完成,DataStage的基本逻辑处理单位是Job,每个Job由许多Stage组成;由Stage来完成对数据的抽取,转换,加载等。
-
Sequential File Stage
-
功能特点:适用于一般顺序文件(定长或不定长),可识别文本文件或IBM大机ebcdic文件。
-
在general说明此文件内容,格式,存储目录等
-
修改文件属性,文件名称,reject方式等到
-
修改文件格式,比如记录结束符是什么,字段分隔符,字符串是用什么区别等
- 输入此文件字段内容
-
-
Annotation
功能特点:一般用于注释,可利用其背景颜色在job中分颜色区别不同功能块
-
Column Export Stage
- Stage类型:Restructure Stage
- 功能说明: 与Column Import Stage相反,将多个类型不同的字段合并成一个string或者binary类型的字段。
- 具体用法:
Stage Page:关键是properties的配置,选择将哪些字段合并,合并后的新字段在Output下的column中直接定义。
。 Inputs Page:对输入数据字段的描述,这里关键是Format的配置,决定合并后的字段的格式
。 Oupputs Page:对最终合并后的输出数据字段的描述
。经过stage的前后数据的对比
合并字段后: