1.將hive目錄下面的jdbc的jar包 復制這個jar文件到Kettle的lib目錄下E:\kettle7.0\data-integration\lib
[datalink@slave3 jdbc]$ sz hive-jdbc-3.1.2-standalone.jar
rz
zmodem trl+C ȡ
100% 70722 KB 3367 KB/s 00:00:21 0 Errorssone.jar...
2.修改plugin.properties文件(D:\data-integration\plugins\pentaho-big-data-plugin)
active.hadoop.configuration=hadoop312 ---可以忽略
3.kettle中添加hive的db連接
kettle對big data的支持還是有限,在關系型數據庫之間進行集成推薦使用,簡單方便。當然還有特別好用的就是各種數據清洗、數據過濾、數據轉換任務。
sqoop用來遷移關系型到非關系型數據庫,用於數據倉庫的數據集成工作。
針對hive上的查詢,kettle可以進行的很快,但是針對hive上插入,就變的十分慢。還只針對特定版本