术语定义: Transformation 转换 Step 步骤 Hops 跳接线 一个步骤是KETTLE中的最小执行单元,用于实现指定的单一逻辑任务。 一个转换是一批步骤组成的网状结构,用于实现一个相对完整的任务,转换,实际上定义了数据的流向。先看一个例子: 上图是一个转换,它从文本文件中读取数据,然后对其进行过滤,排序,最后将结果数据加载到一个关系型数据库中的一张表中。在数据过滤的过程中,当遇到 ...
2014-07-31 00:23 0 6283 推荐指数:
一、概述 转换步骤分类: 1. 增加新的列 2. 字符串处理 3. 行列变换 4. 排序/排重/字段选择 5. 其他转换步骤 二、增加新的列 1.增加常量列 增加一列常量的列 其它增加列的操作 ...
kettle中转换和作业的执行顺序: 1、一个作业内的转换,是顺序执行的。 2、一个转换内的步骤是并行执行的。 3、作业内不支持事务,转换内支持事务。 根据业务需要,通常需要在转换内顺序执行,小技巧如下: 1、执行SQL ...
关于Kettle的事务和转换内步骤的顺序执行 近来有项目中遇到Kettle事务处理和转换内步骤顺序执行的问题。为此进行了研究,找到了一个解决办法。 在Kettle中,一个Job内的转换,缺省是顺序执行的;一个转换内的步骤,缺省是并行执行的。但是,社区版不支持job ...
标志字段:设置标志字段的名称,标志字段用于保存比较的结果,比较结果有下列几种。 1. “identical” – 旧数据和新数据一样 2. “changed” – 数据发生了变化; 3. “ne ...
一、输入步骤概述 输入步骤主要分为以下几类: • 生成记录/自定义常量 • 获取系统信息 • 表输入 • 文本文件输入 • XML 文件输入 • Json输入 • 其他输入步骤 二、生成记录和自定义常量 1.生成 ...
一、概述 数据库表: • 表输出 • 更新,删除,插入/更新 • 批量加载(mysql,oracle) • 数据同步 文件: • SQL 文件输出 • 文本 ...
一、输入步骤概述 输入步骤主要分为以下几类: • 生成记录/自定义常量 • 获取系统信息 • 表输入 • 文本文件输入 • XML 文件输入 • Json输入 • 其他输入步骤 二、生成记录和自定义常量 1.生成记录 ...