1. 上傳jdbc包
目前看ojdbc6.jar 比較通用。只需要上傳這個包就可以了。
- 下載instantclient_11_2 ,進去就能看到ojdbc6.jar 了
- 或者去Oracle所在服務器下,${ORACLE_HOME}/jdbc/lib/,也能看到這個包
上傳路徑是Kettle安裝目錄下的lib目錄下。 例如我的安裝路徑是 D:\g\data-integration,那么就把ojdbc6.jar放到D:\g\data-integration\lib 目錄下.
2. 啟動Kettle
使用kettle安裝目錄下的Spoon.bat,啟動kettle,大約等待1分鍾左右,就起來了。
3. 新建一個轉換
拖拽到空白處后,再雙擊這個圖標就可以進入編輯狀態了。
4. 介紹表輸入
雙擊打開表輸入(Table input)之后,大體的工作區域如下。下面分別對這5個常用的地方做介紹:
-
步驟的名稱,步驟是Kettle轉換對象中的最小執行單元。
-
通常一個轉換可以包含多個步驟,步驟之間的數據流向可以通過箭頭表示。需要注意的是,轉換如果運行起來,則所有的步驟也跟着並發執行。而數據是從箭頭的起始流向箭頭的末尾。
-
這個就好像開車走高速一樣,所有的收費站都是一起運行起來的,而路上的車是由一個收費站進入並且行駛到下一個收費站,也就是說數據是有序的;步驟是並發的。
-
-
連接名稱,這里僅僅是一個連接的名稱,而這個名稱背后代表了一個連接串,而且連接Oracle、MySQL的配置方法類似,但是需要不同的jar包。
-
編輯連接的按鈕,猶豫按鈕前面的下拉列表中沒有連接,所以這個按鈕暫時無法使用。
-
新增連接,如其名。
-
SQL編輯區,表輸入這個步驟其實就是執行一個sql,把數據庫返回的數據推送到下游。
5. 新增數據庫連接
數據庫連接指的就是表輸入中的Connection,這部分我們需要新建一個。點擊表輸入中的“New...” 按鈕
5.1 認識數據庫連接
首先還是大體介紹數據庫連接的工作區域。
- 數據庫連接名稱,這個名稱就是“表輸入”部分需要選擇的數據庫連接名稱。方便表達,總是比連接串一大串寫進去好;
- 連接的類型,到底是連接Oracle還是MySQL?
- 連接方式,最常用的是JDBC和JNDI兩種方式,其實最終也是使用JDBC,只不過JNDI的配置更加方便一些,直接使用配置文件即可。我們的實驗中使用了JDBC方式。
5.2 編輯數據庫連接
如下圖所示,最簡單的數據庫連接需要操作6步。
- 數據庫連接名稱。
- Oracle服務器所在的IP地址。
- 數據庫服務名,這個可以通過
lsnrctl status
獲取到。如果沒權限,就直接問DBA把。 - 用戶名,密碼
- 另外需要注意,如果數據庫的連接端口有了修改,也需要把1521替換掉。
- 最后點擊test,如果成功,則表示數據庫連接創建好了。 記得要保存。