kettle 里用js 调用java类

本文转载自查看原文 2015-02-03 14:32 5828 转发

1. 需要事先将jar包放在kettle 的 libext 目录，kettle 在启动时会自动加载libext 目录下的所有 jar 包。

2. modified java script 步骤要选中 compatibility mode，并将 content 设置为输出的字段。

代码如下:

var 变量 = new Packages.包名(参数 );

kettle modified javascript 步骤的一个例子
例子里用到的 org.htmlparser.Parser 是一个html 的解析器，可以在 sourceforge 上下载。
这个例子使用 org.htmlparser.Parser 包来解析一个 html 格式的字符串，要解析的 html 字符串保存在conntentOld 字段里。
解析过程去除了 html 格式里所有标签，并将结果保存在 content 字段里。
注意事项：
1. 需要事先将htmlparser.jar包放在kettle 的 libext 目录，kettle 在启动时会自动加载libext 目录下的所有 jar 包。
2. modified java script 步骤要选中 compatibility mode，并将 content 设置为输出的字段。
代码如下：
[@more@]var parser = new Packages.org.htmlparser.Parser( contentOld );
var visitor = new Packages.org.htmlparser.visitors.TextExtractingVisitor();
parser.visitAllNodesWith(visitor);
var content = visitor.getExtractedText();

kettle 的实用小功能中介绍了如何批量读取二进制文件的内容，这里说一下批量读取文本文件的方法。
第一步也是使用 Get File Names 步骤，根据正则表达式来获取一个路径下所有指定的文件名。
第二步骤使用 modified javascript 脚本步骤，来读取这些指定的文本文件，脚本如下。
[@more@]
//code begin
file = new Packages.java.io.File(filename.getString());
fileInputStream = new Packages.java.io.FileInputStream(file);
reader = new Packages.java.io.InputStreamReader(fileInputStream);
var cbuf = Packages.com.xgn.ketl.trans.step.infoextractor.InfoExtractor.createCharArray(1024);
var content= new String("");
length = reader.read(cbuf,0,1024);
while (length >0)
{
content += new Packages.java.lang.String(cbuf)
length = reader.read(cbuf,0,1024);
}
////code end
脚本比较简单就是读取文本文件内容，把文件内容放在content 字段里。其中大家有有点费解的可能是下面这句：
var cbuf = Packages.com.xgn.ketl.trans.step.infoextractor.InfoExtractor.createCharArray(1024);
这里使用了一个类的静态方法，这个静态方法的定义如下：
public static char[] createCharArray(int length)
{
return new char[length];
}
实际就是返回一个char数组，因为我不知道如何在 sciprt 里定义一个 char 数组，就用这个方法绕过去了，有知道的朋友请告诉我。
另外要注意，modified javascript 步骤里要选中 “compatbility mode”，content 作为新增加的输出字段。
经过上述两步，文件名和文件内容就都保存在数据行里了。

免责声明！

本站转载的文章为个人学习借鉴使用，本站对版权不负任何法律责任。如果侵犯了您的隐私权益，请联系本站邮箱yoyou2525@163.com删除。

猜您在找 java调用kettle的job和transfer工具类 java程序调用kettle ScriptEngineManager类(Java和JS互相调用) Java通过接口或者抽象类调用方法的时候，怎么知道调用的是哪个实现类里的方法？ java api 调用 kettle 执行etl任务 PHP通过php-java-bridge调用JAVA的jar包里class类 kettle系列-[KettleUtil]kettle插件，类似kettle的自定义java类控件 Java里的时间类以及函数 java调用js脚本 uni-app中调用js里的数组