1、应用是转换里面的第五个分类。应用都是一些工具类。 1.1、替换NULL值就是把null转换为其它的值。NULL值不好进行数据分析 1.2、写日志主要是在调试的时候使用,把日志信息打印到日志窗口。 2、流程是转换里面的第六个分类。流程主要用来控制数据流程和数据流向。 2.1、Switch ...
:空操作 该操作什么都不做,主要作用是,想测试的时候充当一个占位符。 例如:两个文本文件输入,同时连接到流查询步骤中,但是流查询仅仅能从一个流中查询信息,所以可以在同时连接流查询之前, 将两个文本文件输入连接到空操作,然后再让空操作去连接流查询。 空操作组件具有合并记录的作用。 :过滤记录 该步骤通过条件和比较符来过滤记录。 发送ture数据给步骤:指定条件返回true的数据将发送到此步骤 发送 ...
2018-12-07 18:32 0 839 推荐指数:
1、应用是转换里面的第五个分类。应用都是一些工具类。 1.1、替换NULL值就是把null转换为其它的值。NULL值不好进行数据分析 1.2、写日志主要是在调试的时候使用,把日志信息打印到日志窗口。 2、流程是转换里面的第六个分类。流程主要用来控制数据流程和数据流向。 2.1、Switch ...
kettle转换步骤工作组件 这里有四个类构成了这个kettle 步骤/节点,每一个类都有其特定的目的及所扮演的角色。 TemplateStep: 步骤类实现了StepInteface接口,在转换运行时,它的实例将是数据实际处理的位置。每一个执行线程都表示一个此类的实例 ...
KETTLE是一款将数据从来源端经过抽取(extract)、转换(transform)、加载(load)至目的端的非常好用的一款ETL工具。学会它,对于跨数据库的表处理或者定时生成文本,excel等常见需求会处理的很容易。 上图就是一个很复杂的逻辑运算,包括了生成EXCEL、多表关联、调用 ...
一、etl在bi中的作用 BI流程:由数据后台例如数据库-----到数据缓冲区取出来-----数据集市-----给应用服务器提供数据------发布给用户 图中左边:为数据后台、业务系统、可能是数据库,从中抽出数据 中间:是etl的流程,抽到图中左下是数据缓冲区,左上是根据维度建好 ...
前言Kettle控件分为三种:转换控件、作业控件和Hop(跳)。转换控件输入控件表输入 表输入控件是从数据库的表中读取数据的控件。我们可以在表中输入SQL语句(或者通过获取SQL查询语句获取)。比如我们通过获取SQL查询语句获取到SQL语句,我们可以预览这个转换。 预览结果如 ...
1、kettle里面的输入,就是用来抽取数据或生成数据,是ETL操作的E。 2、CSV文件是一种带有固定格式的文本文件。注意:获取字段的时候可以调整自己的字段类型,格式,满足自己的需求哦。 3、文本文件输入,提取日志信息的数据是开发常见的操作,日志信息基本都是文本类型。 首先要获取到要抽取 ...
1、输出是转换里面的第二个分类。输出属于ETL的L,L就是Load加载。微软的Excel目前有两种后缀名的文件分别为:xls和xlsx。xls:2007年之前。xlsx:2007年之后。 Exc ...
1:列转行 2:列转行 3:去除重复记录 步骤名称:保持唯一性 增加计数器到输出?:当勾选了此项,并在计数器字段后给予了名称,则将会在该字段下显示去掉的重复行数。 ...