ETL工具之kettle的使用之異構數據抽取MongoDB——>DB2


環境簡介

數據庫版本:MongoDB 5.0.4  (查詢語句:db.version(); ); DB2 9.7  ;     

kettle版本: 9.2

實現目標:將MongoDB(異構化數據) 抽取到DB2(結構化數據庫);並增加時間戳,區分每天的數據。

具體實現步驟:

1、啟動kettle

安裝好kettle后, 打開data-integration, 雙擊Spoon.bat,  等待幾秒出現圖形操作界面;

 

 

 

2、新建轉換

點擊菜單欄: 文件——新建——轉換。

 

3、連接MongoDB

拖入組件Big Data 下的 MongoDB input 組件, 雙擊組件進行相關配置:

 

 

 

 在 Configure Connection Tab選項里填寫連接地址,端口,連接的用戶,密碼等;

Host name(s) or IP address(es):網絡名稱或者地址。可以輸入多個主機名或IP地址,用逗號分隔。還可以通過將主機名和端口號與冒號分隔開,為每個主機名指定不同的端口號,並將主機名和端口號的組合與逗號分隔開。

Port:端口號
Username:用戶名
Password:密碼
Authenticate using Kerberos:指示是否使用Kerberos服務來管理身份驗證過程。
Connection timeout:連接超時時間(毫秒)
Socket timeout:等待寫操作(以毫秒為單位)的時間

Input Options Tab選項里填寫需要抽取的集合名稱

 

 

 

Fields Tab選項里,點擊Get fields,頁面會出現選擇文檔里的所有字段,可以在字段上右鍵,刪除不需要接入的字段 

 

設置完成后,點擊最下方”預覽“,檢查是否是所需要的數據

 

 

 

 4、獲取變量,增加時間戳字段

 

5、字段選擇:點擊”獲取選擇的字段“(如有不需要的字段, 右鍵刪除即可)

 

 

 

 

 

 

 

 6、表輸出,配置DB2連接

 

 

 

 7、配置完成,點擊保存, 運行即可。

 

 


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM