過了個春節,好長時間沒有更新了,今天接着寫第二部分——數據抽取。
進入界面以后會發現左側菜單有兩個東西:轉換和作業;簡單說一下,轉換是單次的轉換,不可重復,但可重復利用;作業是匯聚了其他操作和多次(可單次)轉換,可定時觸發,可定時循環。集體情況后面方便再說。
KETTLE支持很多的種形式的數據輸入,總體上分三種方式:第一種數據庫數據輸入(支持多種數據庫關系和非關系型數據庫);第二種文本數據輸入(常見的多種文本,txt,xml等),第三種,有系統自動生成的的數據(包括人工在轉換的時候添加的數據)。以數據庫數據為例,操作如下。
左側輸入——>表輸入
步驟名稱(填寫步驟名稱),數據庫連接(選擇輸入數據的數據庫),就和連接資源庫時的步驟差不多了(數據庫連接),獲取SQL查詢語句,選擇要輸入的數據所在的表。
得到查詢表里面的所有字段的SQL語句,根據自己需求,自己調整。
如果有條件查詢里面存在變量,可勾選【允許……】和【替換……】但注意在前一步需要有變量的確定和輸入,這里先做一個簡單的輸入,【預覽】可看,點擊【確定】即可。
一個簡單的表輸入就完成了,其他的輸入基本步驟也是如此,不同的是,如果是文本數據,需要告訴KETTLE怎么區分字段,是用什么分割的。
一般只有數據輸入是沒有用的,我們還需要輸出,更重要的是中間的轉換過程,想要使用一個工具就想好好了解其功能,多試試各種勾選框和按鈕的功能。
最基本的數據輸入完成。