数据清洗工具kettle的下载与简单的使用


1、下载 https://community.hitachivantara.com/docs/DOC-1009855

找到这个downloads,可以根据自己下载,我用的是6.0.1.0-3的版本

2、安装的话看自己的磁盘,安装好是这个样子



这个Spoon.bat批处理文件就是windows环境启动程序,Spoon.sh是在Linux、AppleOSX、Solaris平台上运行的启动程序

3、启动环境

环境就是java的jdk配置环境,jdk 1.5以上就行 ,如何配置jdk就不多说了,可以自己到网上百度####

4、启动

5、写demo

以oracle数据库为例

  1. ceshi数据表结构和表数据

  2. ceshi2数据表结构和表数据



3. 开始写demo,在kettle中双击“转换”或者点“文件-->新建-->转换”或者点击左上角的“+”

4. 打开输入选项,选择表输入,打开输出选项,选择插入/更新(双击或者拖进页面都可以)


5. 把表输入和插入/更新连接起来(选中表输入+shift键,指向插入/更新;或者把鼠标放在表输入上,出现如下图标,选择又箭头)

6. 双击表输入图标,进入表输入

7. 连接之前先把你要链接的数据库的驱动放进kettle的lib目录下

8. 新建链接

9. 测试链接

10. 书写sql,查数据(写完sql可以点击“预览”,看是否是自己想要的数据)

11. 双击插入/更新

1. 新建链接和上一步一样
2. 目标表就是你要把数据导入那个表中
3. 提交记录数量:数据量大的话写1000,数据量小的话默认100就好
4. 用来查询的关键字:点击获取字段获取上一步的字段
5. 更新的字段就是数据更新到那个表的字段


12. 运行

1. 点击倒三角开始运行
2. 点击眼睛图案预览程序运行完成后的样子
3. 图标右上角都有绿色的对号就是程序无误


13. 查看数据

这个是我在网上荡的kettle用户手册
链接:https://pan.baidu.com/s/1mGwSqXjZOmLW3Ngk86YHyA
提取码:eplo


免责声明!

本站转载的文章为个人学习借鉴使用,本站对版权不负任何法律责任。如果侵犯了您的隐私权益,请联系本站邮箱yoyou2525@163.com删除。



 
粤ICP备18138465号  © 2018-2025 CODEPRJ.COM