ETL工具—Kettle數據的導入導出—Excel表到數據庫


案例目的:當Excel中有幾萬條記錄或者更多數據時,使用Kettle導入到數據庫中。速度就能感到比復制粘貼快很多。

  • 這里我會演示將"data.xlsx"表中數據有15萬多條記錄,使用Kettle導入到oracle數據庫的testuser用戶下。

准備工作:1.data.xlsx表;

     2.testuser用戶下要有一個與data.xlsx表結構(列數與字段類型)相同的表。

開始!!!

1.新建一個"轉換",將"Excel輸入"、"表輸出"拖拽到新建的轉換工作空間里

 "文件">"新建">"轉換"打開下圖,並展開左側面板中的"輸入"與"輸出",將"Excel輸入"與"表輸出"拖拽到"轉換1"工作區中。如圖1所示:

圖1:工作區拖拽了"Excel輸入"與"表輸出"效果圖

 

2.設置"Excel輸入"相關參數

1)、雙擊"轉換1"工作區中的"Excel輸入"的圖標,打開設置窗口。

圖2:填寫"表類型"與"文件或目錄"兩行的內容

圖3:點擊增加后,目錄就會在"選中的文件"中出現了

 

圖4:我的數據在sheet1中,那就把sheet1選進列表中

 

圖5:打開"字段"選項卡,點擊"獲取來自頭部數據的字段",注意時間字段格式的正確性

 

3.設置"表輸出"相關參數

1)、雙擊"a"工作區(我將"轉換1"保存命名了a)中的"表輸出"的圖標,打開設置窗口。

 

圖6:設置"數據庫連接"的內容

圖7:設置"目標模式"

圖8:設置"目標表"

圖9:設置本地表與數據庫表的映射(也就是字段是否對應正確)

 

設置完成后點擊"確定"完成設置。

4.運行,將表導入到數據庫中。

圖10:運行和啟動

圖11:檢測運城結果

注:如果"步驟度量"中出現紅色底紋,表示導入失敗。查看日志中的提示。個人經驗,最常出現的報錯是,在"Excel輸入"設置中,字段類型里日期型字段,被設置成了字符型。

 

結束!!!

 

 

 


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM