Kettle介紹
1、什么是ETL?
ETL(Extract-Transform-Load的縮寫,即數據抽取、轉換、裝載的過程),對於企業或行業應用來說,我們經常會遇到各種數據的處理,轉換,遷移,所以了解並掌握一種etl工具的使用,必不可少,這里我要學習的ETL工具是Kettle!
2、什么是Kettle?
Kettle是一款國外開源的ETL工具,純java編寫,可以在Window、Linux、Unix上運行,綠色無需安裝,數據抽取高效穩定。
Kettle 中文名稱叫水壺,該項目的主程序員MATT 希望把各種數據放到一個壺里,然后以一種指定的格式流出。
Kettle這個ETL工具集,它允許你管理來自不同數據庫的數據,通過提供一個圖形化的用戶環境來描述你想做什么,而不是你想怎么做。
Kettle中有兩種腳本文件,transformation和job,transformation完成針對數據的基礎轉換,job則完成整個工作流的控制。
Kettle(現在已經更名為PDI,Pentaho Data Integration-Pentaho數據集成)。
3、Kettle的結構。
4、Kettle的結構-Spoon和Data Integration Server。
Spoon是構建ETL Jobs和Transformations的工具。Spoon以拖拽的方式圖形化設計,能夠通過spoon調用專用的數據集成引擎或者集群。
Data Integration Server是一個專用的ETL Server,它的主要功能有:
5、Kettle的結構-Enterprise Console。
Enterprise Console(企業控制台)提供了一個小型的客戶端,用於管理Pentaho Data Integration企業版的部署。包括企業版本的證書管理、監控和控制遠程Pentaho Data Integration服務器上的活動、分析已登記的作業和轉換的動態績效。
6、kettle的核心組件。
7、Kettle概念模型。
Kettle的執行分為兩個層次:Job(作業)和Transformation(轉換)。
Kettle安裝、配置
環境要求:
-
安裝、配置好JDK
1、下載Kettle
-
pdi-ce-8.2.0.0-342.zip
網盤下載地址:
需要的小伙伴,請關注微信公眾號: Transkai, 或者掃描下方公眾號二維碼,回復關鍵字:kettle, 即可免費獲取kettle。
2、解壓Kettle
3、雙擊Spoon.bat即可驅動Kettle