一、 输入组件 1.1表输入 从指定的数据库中,通过sql语句来查询数据加载到内存。 允许简易转换:勾选后可以避免不必要的字段的数据类型转换,从而提高性能。 替换sql语句里的变量:勾选后可以通过${queryDate}来使用queryDate变量。 从步骤中插入数据:以上次的步骤中 ...
输出是转换里面的第二个分类。输出属于ETL的L,L就是Load加载。微软的Excel目前有两种后缀名的文件分别为:xls和xlsx。xls: 年之前。xlsx: 年之后。 Excel输出 Microsoft Excel输出的区别,Excel输出只能xls后缀名称的文件,Microsoft Excel输出可以生成xls后缀和xlsx后缀名称的文件的。 Excel输出,可以获取字段,如下所示: Mi ...
2020-02-15 12:16 0 1127 推荐指数:
一、 输入组件 1.1表输入 从指定的数据库中,通过sql语句来查询数据加载到内存。 允许简易转换:勾选后可以避免不必要的字段的数据类型转换,从而提高性能。 替换sql语句里的变量:勾选后可以通过${queryDate}来使用queryDate变量。 从步骤中插入数据:以上次的步骤中 ...
...
前言Kettle控件分为三种:转换控件、作业控件和Hop(跳)。转换控件输入控件表输入 表输入控件是从数据库的表中读取数据的控件。我们可以在表中输入SQL语句(或者通过获取SQL查询语句获取)。比如我们通过获取SQL查询语句获取到SQL语句,我们可以预览这个转换。 预览结果如 ...
1、kettle里面的输入,就是用来抽取数据或生成数据,是ETL操作的E。 2、CSV文件是一种带有固定格式的文本文件。注意:获取字段的时候可以调整自己的字段类型,格式,满足自己的需求哦。 3、文本文件输入,提取日志信息的数据是开发常见的操作,日志信息基本都是文本类型。 首先要获取到要抽取 ...
一、概述 数据库表: • 表输出 • 更新,删除,插入/更新 • 批量加载(mysql,oracle) • 数据同步 文件: • SQL 文件输出 • 文本文件输出 • XML 输出 • Excel Output/Excel Writer ...
1:列转行 2:列转行 3:去除重复记录 步骤名称:保持唯一性 增加计数器到输出?:当勾选了此项,并在计数器字段后给予了名称,则将会在该字段下显示去掉的重复行数。 字段名称:用来去重的字段,可选多个字段,表示多个字段都相同时表示重复 ...
。 空操作组件具有合并记录的作用。 2:过滤记录 该步骤通过条件和比较 ...
分组: 步骤名称:在单一转换中名称唯一。 分组字段:指定分组的字段。 聚合:指定需要聚合的字段,方法以及新字段结果的名称。 包含所有的行:如果选择该项,输出中就包含所有的行,不仅仅是聚合。 临时文件目录:临时文件存储的目录。 临时文件前缀:指定命名临时文件时的文件前缀 ...