kettle工具教程


安裝教程

1、下載(官網:https://community.hitachivantara.com/s/article/data-integration-kettle)

 

   稍后跳轉5秒后就會自動下載

2、下載數據庫鏈接驅動

sql:https://docs.microsoft.com/zh-cn/sql/connect/jdbc/download-microsoft-jdbc-driver-for-sql-server?view=sql-server-ver15

 

 

 mysql:https://dev.mysql.com/downloads/connector/j/

 

 

  

 解壓后將相應jdk版本的驅動放入根目錄下的lib文件夾即可。

 

kettle基礎

  1、雙擊啟動程序【Spoon.bat】

  2、創建DB,創建完后可點擊【測試】驗證是否創建成功

 

 

 

 

   3、創建轉換

在【輸入】中選擇【表輸入】,在輸出中選擇【插入/更新】

連線操作:單擊表輸入節點后,按住shift即可拖拉。單擊連線會變灰,即取消該操作。

 

 

先選擇數據庫連接,sql語句可以自己寫,也可以點擊【獲取sql查詢語句】自動生成,寫完后可點擊【預覽】查看查詢數據,最后點擊【確定】。

 

 【插入/更新】操作差不多。唯一提一點就是如果你偷懶點了【獲取字段】,它將自動按輸入的內容,加載所有字段,如果兩個表字段名不一致,你還得手動重新選擇

  4、保存本地后運行;

  

 

   5、轉換沒問題后可新建【作業】

  

 

   【start】雙擊后可設置循環周期參數,雙擊【轉換】后選擇之前運行時保存在本地的轉換

  

kettle進階

  1、DB連接共享

  

 作用:創建一次DB后,后面可直接拿來用,無需再次創建。

  2、資源庫

  

 

 

 

 

 

 點擊右上角的【connect】就會進入資源庫選擇頁面。首先打開的是Pentaho自己的服務器,企業一般不會去使用,當然你也可以用。點擊【other repositories】后有兩個選擇,第一個是數據庫資源庫,第二個是文件資源庫。

區別:數據庫會在庫內創建40幾張表(建議單獨弄個庫),需要用戶名密碼(admin/admin),庫內DB連接與作業共享,方便多人合作;

  文件資源庫會默認本地一個目錄,再次打開時會直接訪問該目錄,本地操作,不需要網絡,只能共享作業,DB還得額外點共享;

相同點:連接資源庫之后,選打開作業只能選擇資源庫目錄下的文件,無法訪問整個硬盤。

注:創建資源庫時,千萬不要有任何中文字符!!!

 3、web管理

  a.打開服務:用管理員身份運行dos命令框,並進入kettle安裝目錄,接着運行命令

carte.bat 127.0.0.1 8022

  注:端口隨便寫,只要不沖突即可

  

 

   b.配置子服務器

 

 

 

 

   c.新增運行配置

 

 

   d、作業運行配置

 

 

  e、打開網頁 127.0.0.1:8022

 用戶名密碼看

 

 

 

 

 常見錯誤

1、創建資源庫中含有中文,導致無法顯示connet或者管理操作;

下圖中【repositories.xml】是資源庫文件,打開后將中文內容去掉或者刪除整個文件,重新創建資源庫都行。

 

 2、Unexpected error reading step information from the repository Invalid byte 1 of 1-byte UTF-8 sequence.

編輯安裝根目錄下的【Spoon.bat】,打開后在如圖位置上添加內容:-Dfile.encoding=UTF-8

 

 

Unexpected error reading step information from the repository Invalid byte 1 of 1-byte UTF-8 sequence.


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM