PDI(Kettle)的使用一


Kettle 是 PDI 以前的名稱,PDI 的全稱是Pentaho Data Integeration

Kettle是ETL中的一個開源工具,Java開發

https://github.com/pentaho/pentaho-kettle

ETL是EXTRACT(抽取)、TRANSFORM(轉換)、LOAD(加載)

Kettle的主要工具:

  Spoon:

    圖形化工具,用於快速設計和維護復雜的ETL工作流

  Pan:

    用來執行轉換

  Kitchen:

    用來執行作業

Kettle中有兩種腳本文件

  transformation完成針對數據的基礎轉換

  job則完成整個工作流的控制

下載pdi-ce-9.0.0.0-423.zip版本,解壓

雙擊Spoon.bat

轉換eg:

1.創建轉換

  雙擊轉換

2.數據庫連接

  雙擊DB,設置連接信息

3.核心對象

  將表輸入和表輸出拖拽到右側轉換窗口

   編輯表輸入

 

   將兩個操作進行連接:按shift+指針從表輸入拖拽至表輸出

   編輯表輸出

   保存當前轉化

  執行轉換

   數據從localTest指定的庫sys_user到了localTest1指定庫的user表

注:

  在Kettle中,數據的單位是行,數據流就是數據行從一個步驟到另一個步驟的移動

 


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM