安裝教程
1、下載(官網:https://community.hitachivantara.com/s/article/data-integration-kettle)
稍后跳轉5秒后就會自動下載
2、下載數據庫鏈接驅動
mysql:https://dev.mysql.com/downloads/connector/j/
解壓后將相應jdk版本的驅動放入根目錄下的lib文件夾即可。
kettle基礎
1、雙擊啟動程序【Spoon.bat】
2、創建DB,創建完后可點擊【測試】驗證是否創建成功
3、創建轉換
在【輸入】中選擇【表輸入】,在輸出中選擇【插入/更新】
連線操作:單擊表輸入節點后,按住shift即可拖拉。單擊連線會變灰,即取消該操作。
先選擇數據庫連接,sql語句可以自己寫,也可以點擊【獲取sql查詢語句】自動生成,寫完后可點擊【預覽】查看查詢數據,最后點擊【確定】。
【插入/更新】操作差不多。唯一提一點就是如果你偷懶點了【獲取字段】,它將自動按輸入的內容,加載所有字段,如果兩個表字段名不一致,你還得手動重新選擇
4、保存本地后運行;
5、轉換沒問題后可新建【作業】
【start】雙擊后可設置循環周期參數,雙擊【轉換】后選擇之前運行時保存在本地的轉換
kettle進階
1、DB連接共享
作用:創建一次DB后,后面可直接拿來用,無需再次創建。
2、資源庫
點擊右上角的【connect】就會進入資源庫選擇頁面。首先打開的是Pentaho自己的服務器,企業一般不會去使用,當然你也可以用。點擊【other repositories】后有兩個選擇,第一個是數據庫資源庫,第二個是文件資源庫。
區別:數據庫會在庫內創建40幾張表(建議單獨弄個庫),需要用戶名密碼(admin/admin),庫內DB連接與作業共享,方便多人合作;
文件資源庫會默認本地一個目錄,再次打開時會直接訪問該目錄,本地操作,不需要網絡,只能共享作業,DB還得額外點共享;
相同點:連接資源庫之后,選打開作業只能選擇資源庫目錄下的文件,無法訪問整個硬盤。
注:創建資源庫時,千萬不要有任何中文字符!!!
3、web管理
a.打開服務:用管理員身份運行dos命令框,並進入kettle安裝目錄,接着運行命令
carte.bat 127.0.0.1 8022
注:端口隨便寫,只要不沖突即可
b.配置子服務器
c.新增運行配置
d、作業運行配置
e、打開網頁 127.0.0.1:8022
用戶名密碼看
常見錯誤
1、創建資源庫中含有中文,導致無法顯示connet或者管理操作;
下圖中【repositories.xml】是資源庫文件,打開后將中文內容去掉或者刪除整個文件,重新創建資源庫都行。
2、Unexpected error reading step information from the repository Invalid byte 1 of 1-byte UTF-8 sequence.
編輯安裝根目錄下的【Spoon.bat】,打開后在如圖位置上添加內容:-Dfile.encoding=UTF-8
Unexpected error reading step information from the repository Invalid byte 1 of 1-byte UTF-8 sequence.