在kettle中的轉換或者作業等資源的存儲的倉庫稱為資源庫:分為文件資源庫、數據庫資源庫。
一個轉換或者作業可以屬於某個資源庫或者一個單獨的文件形態存在。
一、數據庫資源庫
1.1在mysql中創建一個數據庫作為數據庫資源庫
1.2創建數據庫資源庫工具--》資源庫--》連接資源庫--》點擊加號--》選擇創建數據庫資源庫
因為我們要使用mysql作為資源庫,所以kettle需要連接到mysql,也就是說需要mysql的驅動包,我們要把驅動包拷貝到kettle的lib目錄下。
創建數據庫連接並且通過測試
選擇創建或更新
1.3創建完成后,驗證數據庫中是否創建了很多的表
看到這些表,就表示創建完成了一個數據庫資源庫了。
1.4創建一個轉換,並且創建一個DB連接,驗證這個不共享的DB連接能不能在資源庫中共享
經過測試是可以的。
二、文件資源庫
工具--》資源庫--》斷開資源庫
使用上面的步驟來退出數據庫資源庫
2.1創建文件資源庫
和上面創建數據庫資源庫的方式一樣,但是選擇的是創建文件資源庫。
2.2在文件資源庫下,創建一個DB連接,驗證是否能在文件資源庫內共享
答案是可以的
三、需求:將mysql中的表導出成txt文件
在ldp_huyu數據庫中有如下的一張person表
3.1建立如下圖的轉換
其中表輸入的配置:
其中文本文件輸出的配置:
3.2運行這個轉換
最后生成文件
四、數據庫資源庫和文件資源庫的比較
使用數據庫來管理,更容易跨平台和共享,但是在版本控制方面不如文件資源庫好,並且數據庫需要走網絡,網絡連接的異常也會導致job失敗
使用文件資源庫比較麻煩的是跨平台,一般和svn等版本控制的工具結合使用。