環境簡介:
數據庫版本:MongoDB 5.0.4 (查詢語句:db.version(); ); DB2 9.7 ;
kettle版本: 9.2
實現目標:將MongoDB(異構化數據) 抽取到DB2(結構化數據庫);並增加時間戳,區分每天的數據。
具體實現步驟:
1、啟動kettle
安裝好kettle后, 打開data-integration, 雙擊Spoon.bat, 等待幾秒出現圖形操作界面;

2、新建轉換
點擊菜單欄: 文件——新建——轉換。
3、連接MongoDB
拖入組件Big Data 下的 MongoDB input 組件, 雙擊組件進行相關配置:

在 Configure Connection Tab選項里填寫連接地址,端口,連接的用戶,密碼等;
Host name(s) or IP address(es):網絡名稱或者地址。可以輸入多個主機名或IP地址,用逗號分隔。還可以通過將主機名和端口號與冒號分隔開,為每個主機名指定不同的端口號,並將主機名和端口號的組合與逗號分隔開。
Port:端口號
Username:用戶名
Password:密碼
Authenticate using Kerberos:指示是否使用Kerberos服務來管理身份驗證過程。
Connection timeout:連接超時時間(毫秒)
Socket timeout:等待寫操作(以毫秒為單位)的時間

在Input Options Tab選項里填寫需要抽取的集合名稱

在Fields Tab選項里,點擊Get fields,頁面會出現選擇文檔里的所有字段,可以在字段上右鍵,刪除不需要接入的字段

設置完成后,點擊最下方”預覽“,檢查是否是所需要的數據

4、獲取變量,增加時間戳字段

5、字段選擇:點擊”獲取選擇的字段“(如有不需要的字段, 右鍵刪除即可)

6、表輸出,配置DB2連接

7、配置完成,點擊保存, 運行即可。

