kettle記錄集(Merge Join)使用


 

 

 

果兩個表需要進行連接查詢篩選出數據,那么可以使用記錄集組件。(Merge Join)。

 

使用之前要進行排序:

使用記錄集之前,要對輸入的兩張表進行排序,如果不排序,會導致兩張表連接的時候出現問題,關聯的數據變少。並且排序的順序必須一致,比如

A表的a字段和B表的b字段 是連接條件,那么這倆要排序,而且規則要一樣

排序有2種方式:

1 直接在表中用order by 排序

 

2 使用排序記錄組件進行

 

 

 兩種排序方式的比較:第一種還是在數據庫種排,第二種利用緩存排序

 

實際業務:從mysql種取兩張表,關聯,排序后,用記錄集連接取出關聯數據。將關聯出的數據全部寫入mongodb中。

 

 

 

 

 

 


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM