1、kettle介紹
kettle是一個ETL(Extract, Transform and Load抽取、轉換、加載)工具,ETL工具在數據倉庫項目使用很頻繁,kettle也能夠應用在下面一些場景:
-
在不同應用或數據庫之間整合數據
-
把數據庫中的數據導出到文本文件
-
大批量數據裝加載數據庫
-
數據清洗
-
集成應用相關項目是個使用
kettle使用很easy,通過圖形界面設計實現做什么業務,無需寫代碼去實現。因此,kettle是以面向元數據來設計。
kettle支持非常多種輸入和輸出格式。包含文本文件。數據表。以及商業和免費的數據庫引擎。另外,kettle強大的轉換功能讓您非常方便操縱數據。
以下展示一個簡單的“Hello World”演示樣例,本教程將告訴你怎樣輕松用kettle工作。讓你有基礎可以學習更復雜的轉換功能。
-
安裝kettle
-
kettle設計工具spoon介紹
-
hello world演示樣例
-
又一次設計helloworld演示樣例
2、入門演示樣例學習
2.1、安裝kettle
首先通過官網下載kettle;
需求環境:
kettle須要jre1.5及以上版本號。能夠通過oracle官網免費下載;
kettle安裝
kettle無需安裝。直接解壓zip文件到指定的目錄。在類unix操作系統上。須要運行下面腳本:
cd Kettle
chmod +x *.sh
執行
kettle中的一個圖形用戶界面叫spoon,spoon能夠設計轉換和作業,也能夠執行轉換和作業,以下的內容將繼續介紹他們。
2.2、kettle設計工具spoon介紹
Spoon是一個圖形設計工具,用來設計和測試數據交換處理流程,也能夠通過命令行(終端)運行處理流程。
資源庫和文件
在spoon中設計作業和轉換。kettle提供兩種方式存儲:資源庫和文件;
假設你選擇資源庫,spoon第一次啟動時須要創建資源庫。選擇文件方法,作業保存文件是的擴展名是KJB。轉換文件的擴展名為KTR,為了簡化學習,以下教程採用后者。
啟動spoon
在windows中運行spoon.bat,在類unix系統中運行spoon.sh;啟動時首先出現一個對話框窗體提示選擇資源庫及輸入連接信息,點擊取消button。
然后能夠看到歡迎窗體,點擊“工具”菜單下的“選項”。彈出窗體中能夠進行一些全局設置,如語言、日志等信息,設置后需重新啟動才干生效。
以下內容參見《kettle Hello World教程》