數據清洗工具kettle的下載與簡單的使用


1、下載 https://community.hitachivantara.com/docs/DOC-1009855

找到這個downloads,可以根據自己下載,我用的是6.0.1.0-3的版本

2、安裝的話看自己的磁盤,安裝好是這個樣子



這個Spoon.bat批處理文件就是windows環境啟動程序,Spoon.sh是在Linux、AppleOSX、Solaris平台上運行的啟動程序

3、啟動環境

環境就是java的jdk配置環境,jdk 1.5以上就行 ,如何配置jdk就不多說了,可以自己到網上百度####

4、啟動

5、寫demo

以oracle數據庫為例

  1. ceshi數據表結構和表數據

  2. ceshi2數據表結構和表數據



3. 開始寫demo,在kettle中雙擊“轉換”或者點“文件-->新建-->轉換”或者點擊左上角的“+”

4. 打開輸入選項,選擇表輸入,打開輸出選項,選擇插入/更新(雙擊或者拖進頁面都可以)


5. 把表輸入和插入/更新連接起來(選中表輸入+shift鍵,指向插入/更新;或者把鼠標放在表輸入上,出現如下圖標,選擇又箭頭)

6. 雙擊表輸入圖標,進入表輸入

7. 連接之前先把你要鏈接的數據庫的驅動放進kettle的lib目錄下

8. 新建鏈接

9. 測試鏈接

10. 書寫sql,查數據(寫完sql可以點擊“預覽”,看是否是自己想要的數據)

11. 雙擊插入/更新

1. 新建鏈接和上一步一樣
2. 目標表就是你要把數據導入那個表中
3. 提交記錄數量:數據量大的話寫1000,數據量小的話默認100就好
4. 用來查詢的關鍵字:點擊獲取字段獲取上一步的字段
5. 更新的字段就是數據更新到那個表的字段


12. 運行

1. 點擊倒三角開始運行
2. 點擊眼睛圖案預覽程序運行完成后的樣子
3. 圖標右上角都有綠色的對號就是程序無誤


13. 查看數據

這個是我在網上盪的kettle用戶手冊
鏈接:https://pan.baidu.com/s/1mGwSqXjZOmLW3Ngk86YHyA
提取碼:eplo


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM