【引用下官方說明】
RDBMS Reader是一個通用的關系數據庫讀插件,您可以通過添加、注冊數據庫驅動等方式增加各種關系型數據庫的讀支持。
本文為您介紹如何通過RDBMS Reader添加關系型數據庫驅動。
一、前提條件
在添加關系型數據庫驅動前,您需要購買ECS服務器作為您的自定義資源組,建議購買規格如下:
- 使用CentOS 6、CentOS 7或AliyunOS。
- 如果您添加的ECS需要執行MaxCompute任務或同步任務,需要檢查當前ECS的python版本是否為Python2.6或2.7的版本(CentOS 5的Python版本為2.4,其它OS自帶2.6以上版本)。
- 以是否能夠ping通www.aliyun.com作為衡量標准,確認ECS可以訪問公網。
- 建議ECS的配置為8核16G。
二、背景信息
RDBMS Reader通過JDBC連接器連接至遠程的RDBMS數據庫,並根據您配置的信息生成查詢SQL語句,發送至遠程RDBMS數據庫,執行該SQL並返回結果。然后使用數據同步自定義的數據類型拼裝為抽象的數據集,傳遞給下游Writer處理。詳情請參見RDBMS Reader。
三、添加自定義資源組
- 登錄DataWorks控制台。
- 在左側導航欄,單擊工作空間列表。
- 單擊相應工作空間后的進入數據集成。
- 如果您已在DataWorks的某個功能模塊,請單擊左上角的圖標,選擇全部產品 > 數據集成,即可跳轉至數據集成頁面。
- 在左側導航欄,單擊自定義資源組,進入自定義資源組管理頁面。
- 單擊右上角的新增自定義資源組。
- 安裝Agent並初始化,詳情請參見新增自定義數據集成資源組。
- 待服務器狀態為可用時,則成功添加自定義資源組。
- 如果刷新后還是停止狀態,請切換至admin賬號,執行下述命令重啟alisa。
/home/admin/alisatasknode/target/alisatasknode/bin/serverct1 restart
四、添加MySQL驅動
- 進入rdbmsreader目錄下的libs子目錄,上傳您下載的MySQL JAR包。
例如下圖中的 mysql-connector-java-5.1.47.jar。
五、配置數據同步任務
目前RDBMS Reader僅支持通過腳本模式配置同步任務,配置示例如下。
{ "job": { "setting": { "speed": { "byte": 1048576 }, "errorLimit": { "record": 0, "percentage": 0.02 } }, "content": [ { "reader": { "name": "rdbmsreader", "parameter": { "username": "xxxxx", "password": "yyyyyy", "column": [ "*", ], "splitPk": "id", "connection": [ { "table": [ "a2" ], "jdbcUrl": [ "jdbc:mysql://xxx.mysql.yy.aliyuncs.com:3306/xxx" //直接配置您的SQL地址。 ] } ], "where": "" } }, "writer": { //writer部分根據您的需要進行配置即可。 "name": "streamwriter", "parameter": { "print": true } } } ] } }