kettle常見的資源庫有3種:數據庫資源庫、文件資源庫、pentaho資源庫。
文件資源庫是在一個文件目錄下定義一個資源庫,因為kettle使用的是虛擬文件系統(Apache VFS),所以這里的文件目錄是一個廣泛的概念,包括了zip文件、web服務、FTP服務。
pentaho資源庫是一個插件(kettle企業版中有),實際是一個內容管理系統(CMS),它具備一個理想的資源庫的所有特性,包括版本控制和依賴完整性檢查。
數據庫資源庫是把所有的ETL信息保存在關系型數據庫中,包括數據庫連接、轉換和作業。將已開發的ETL轉換、作業和相關配置保存在數據庫資源庫中便於保存、管理以及遠程調度。本篇文章主要介紹數據庫資源庫創建方法:
1、進入spoon,工具--資源庫--連接資源庫,點擊加號+新建資源庫
2、選擇數據庫資源庫,點擊確定
3、數據庫連接選擇新建,配置數據庫連接信息,建議新建一個空白數據庫
4、配置好數據庫連接,選擇創建或更新,繼續選擇是
5、選擇執行SQL語句
6、提示執行SQL錯誤,選擇確定,稍后在處理這個錯誤,對上述sql執行提示的所有錯誤全部選擇確定
7、現在連接剛剛創建的資源庫會報錯,如下
8、下面進入sql server客戶端(因為這里使用的是sql server數據庫資源庫,根據使用的資源庫作調整),連接剛剛創建的資源庫,執行下面的SQL語句
DELETE TABLE R_VERSION;
CREATE TABLE R_VERSION
( ID_VERSION INTEGER,
MAJOR_VERSION INTEGER,
MINOR_VERSION INTEGER,
UPGRADE_DATE DATETIME,
IS_UPGRADE CHARACTER (1)
);
INSERT INTO R_VERSION (ID_VERSION, MAJOR_VERSION, MINOR_VERSION, UPGRADE_DATE, IS_UPGRADE) VALUES (1, 5, 0, '2017-02-03', 'N');
不同數據庫的sql 語句寫法可能不同,目標是讓上面標紅的sql語句成功執行
現在連接剛剛創建的數據庫資源庫會發現用戶名密碼錯誤,執行下面的sql語句,添加默認用戶,此時的用戶名密碼都是admin
INSERT INTO R_USER (ID_USER, LOGIN, PASSWORD, NAME, DESCRIPTION, ENABLED)
VALUES (1, 'admin', '2be98afc86aa7f2e4cb79ce71da9fa6d4', 'Administrator', 'User manager', '1')
現在重新連接剛剛創建的資源庫,連接成功!