kettle新手上路,煩死了,工具好用,批量導入數據也快,就是有很多小細節需要注意。
使用kettle進行數據導入時,因為最近在做json數據的入庫,以JSON Input為例進行說明;
首先是大概流程:
我的是這樣,並不是說就必須是這樣。
(1)導json數據,JSON Input 少不了的,具體怎么配置通用路徑,第一張圖已經展示出來了;
(2)然后js腳本,篩選自己需要的字段(這個就不截圖了啊,至於生成cscs_id是因為我需要);
(3)然后就是配置表輸出,怎么連接就不截圖了,測試鏈接成功之后,點開編輯,像我這樣配置即可,解決亂碼問題的,自己剛開始弄的時候,網上都說的是,配置一個utf8就行,但是我的還是亂碼,最后這樣配置,亂碼問題才解決(當然數據庫我用的mysql,其他數據庫是不是這樣,就不清楚了!)。
kettle這一款開源的ETL工具很好用,教程網上也搜得到!