資源庫的作用:資源庫是用來保存操作步驟和相關的日志,轉換,JOB 等信息。用戶通過圖形界面創建的的轉換任務可以保存在資源庫中。資源庫可以是各種常見的數據庫,用戶通過用戶名/ 密碼來訪問資源庫中的資源,默認的用戶名/ 密碼是admin/admin. 資源庫並不是必須的,如果沒有資源庫,用戶還可以把轉換任務保存在 xml 文件中。
轉換文件以ktr為擴展名,作業文件以kjb為擴展名。
kettle的資源庫包括數據庫資源庫和文件資源庫,在文件和數據庫的基礎上的封裝,實現org.pentaho.di.repository.Repository接口。
kettle資源庫配置
1.啟動Spoon.bat,點擊+,彈出下圖1窗口。
2.選擇this repository uses a central relational database to store ETL metadata。彈出下圖2窗口
2.選擇this repository uses a central relational database to store ETL metadata。彈出下圖2窗口
4點擊測試,測試是否配置正確,是否能連接上資源數據庫。如下圖4
5.點擊OK按鈕保存資源
6.點擊執行,執行sql語句在數據庫中創建表和相關信息。創建完成后點擊清除緩存。
7.選擇配置好的資源庫,使用admin登陸。
配置JOB,轉換,日志信息就會保存到數據庫中。
注意:
1.點擊Spoon.bat一閃而過,可能是因為沒有配置KETTLE_HOME環境變量
2.在配置資源庫的數據連接時,點擊測試報錯如圖,是因為缺少數據庫連接的驅動,將對應數據庫驅動的jar包放到下kettle的目錄:data-integration\libext\JDBC下。 重現 啟動Spoon.bat
2.在配置資源庫的數據連接時,點擊測試報錯如圖,是因為缺少數據庫連接的驅動,將對應數據庫驅動的jar包放到下kettle的目錄:data-integration\libext\JDBC下。 重現 啟動Spoon.bat