前言:
真的很久沒在博客園上更新博客了, 現在趁這段空閑的時間, 對之前接觸的一些工程知識做下總結. 先來講下借用Groovy如何來實現代碼的熱載, 以及其中涉及到的原理和需要注意的點.
總的來說, Groovy作為一本動態編譯語言, 其對標應該是c/c++體系中的lua, 在一些業務邏輯變動頻繁的場景, 其意義非常的重大.
簡單入門:
本文的主題是Groovy實現代碼熱載, 其他大背景是java實現主干代碼, groovy實現易變動的邏輯代碼. 先來看下java是如何調用的groovy腳本的.
import groovy.lang.Binding;
import groovy.lang.GroovyShell;
public class GroovyTest {
public static void main(String[] args) {
// *) groovy 代碼
String script = "println 'hello'; 'name = ' + name;";
// *) 傳入參數
Binding binding = new Binding();
binding.setVariable("name", "lilei");
// *) 執行腳本代碼
GroovyShell shell = new GroovyShell(binding);
Object res = shell.evaluate(script);
System.out.println(res);
}
}
這段代碼的輸出為:
hello name = lilei
Binding類主要用於傳遞參數集, 而GroovyShell則主要用於編譯執行Groovy代碼. 是不是比想象中的要簡答, ^_^.
當然java調用groovy還有其他的方式, 下文會涉及到.
原理分析:
下面這段其實大有文章.
GroovyShell shell = new GroovyShell(binding); Object res = shell.evaluate(script);
對於函數evaluate, 我們追蹤進去, 會有不少的重新認識.
public Object evaluate(GroovyCodeSource codeSource) throws CompilationFailedException {
Script script = this.parse(codeSource);
return script.run();
}
public Script parse(GroovyCodeSource codeSource) throws CompilationFailedException {
return InvokerHelper.createScript(this.parseClass(codeSource), this.context);
}
其大致的思路, 為Groovy腳本代碼包裝生成class, 然后產生該類實例對象, 在具體執行其包裝的邏輯代碼.
但是這邊需要注意的情況:
public Class parseClass(String text) throws CompilationFailedException {
return this.parseClass(text, "script" + System.currentTimeMillis() + Math.abs(text.hashCode()) + ".groovy");
}
對於groovy腳本, 它默認會生成名字為script + System.currentTimeMillis() + Math.abs(text.hashCode())的class類, 也就是說傳入腳本, 它都會生成一個新類, 就算同一段groovy腳本代碼, 每調用一次, 都會生成一個新類.
陷阱評估:
原理我們基本上理解了, 但是讓我們來構造一段代碼, 看看是否有哪些陷阱.
import groovy.lang.Binding;
import groovy.lang.GroovyShell;
import groovy.lang.Script;
import java.util.Map;
import java.util.TreeMap;
public class GroovyTest2 {
private static GroovyShell shell = new GroovyShell();
public static Object handle(String script, Map<String, Object> params) {
Binding binding = new Binding();
for ( Map.Entry<String, Object> ent : params.entrySet() ) {
binding.setVariable(ent.getKey(), ent.getValue());
}
Script sci = shell.parse(script);
sci.setBinding(binding);
return sci.run();
}
public static void main(String[] args) {
String script = "println 'hello'; 'name = ' + name;";
Map<String, Object> params = new TreeMap<String, Object>();
params.put("name", "lilei");
while(true) {
handle(script, params);
}
}
}
這段代碼執行到最后的結果為, 頻繁觸發full gc, 究其原因為PermGen區爆滿. 這是為何呢?
如上所分析的, 雖然是同一份腳本代碼, 但是都為其每次調用, 間接生成了一個class類. 對於full gc, 除了清理老年代, 也會順便清理永久代(PermGen), 但為何不清理這些一次性的class呢? 答案是gc條件不成立.
引用下class被gc, 需滿足的三個條件:
1). 該類所有的實例都已經被GC
2). 加載該類的ClassLoader已經被GC
3). 該類的java.lang.Class對象沒有在任何地方被引用
加載類的ClassLoader實例被GroovyShell所持有, 作為靜態變量(gc root), 條件2不成立, GroovyClassLoader有個map成員, 會緩存編譯的class, 因此條件3都不成立.
有人會問, 為何不把GroovyShell對象, 作為一個臨時變量呢?
public static Object handle(String script, Map<String, Object> params) {
Binding binding = new Binding();
for ( Map.Entry<String, Object> ent : params.entrySet() ) {
binding.setVariable(ent.getKey(), ent.getValue());
}
GroovyShell shell = new GroovyShell();
Script sci = shell.parse(script);
sci.setBinding(binding);
return sci.run();
}
實際上, 還是治標不治本, 只是說class能被gc掉, 但是清理的速度可能趕不上產生的速度, 依舊頻繁觸發full gc.
推薦做法:
解決上述問題很簡單, 就是引入緩存, 當然緩存的對象不上Script實例(在多線程環境下, 會遇到數據混亂的問題, 對象有狀態), 而是Script.class本身. 對應的key為腳本代碼的指紋.
大致的代碼如下所示:
private static ConcurrentHashMap<String, Class<Script>> zlassMaps
= new ConcurrentHashMap<String, Class<Script>>();
public static Object invoke(String scriptText, Map<String, Object> params) {
String key = fingerKey(scriptText);
Class<Script> script = zlassMaps.get(key);
if ( script == null ) {
synchronized (key.intern()) {
// Double Check
script = zlassMaps.get(key);
if ( script == null ) {
GroovyClassLoader classLoader = new GroovyClassLoader();
script = classLoader.parseClass(scriptText);
zlassMaps.put(key, script);
}
}
}
Binding binding = new Binding();
for ( Map.Entry<String, Object> ent : params.entrySet() ) {
binding.setVariable(ent.getKey(), ent.getValue());
}
Script scriptObj = InvokerHelper.createScript(script, binding);
return scriptObj.run();
}
// *) 為腳本代碼生成md5指紋
public static String fingerKey(String scriptText) {
try {
MessageDigest md = MessageDigest.getInstance("MD5");
byte[] bytes = md.digest(scriptText.getBytes("utf-8"));
final char[] HEX_DIGITS = "0123456789ABCDEF".toCharArray();
StringBuilder ret = new StringBuilder(bytes.length * 2);
for (int i=0; i<bytes.length; i++) {
ret.append(HEX_DIGITS[(bytes[i] >> 4) & 0x0f]);
ret.append(HEX_DIGITS[bytes[i] & 0x0f]);
}
return ret.toString();
} catch (Exception e) {
throw new RuntimeException(e);
}
}
這邊會為每個新類單獨創建一個GroovyClassLoader對象, 也是巧妙地回避之前的陷阱.
總結:
這邊沒有深入研究java中類的加載機制, 只是涉及class被gc的先決條件, 同時提供了一種思路, 如何借助groovy實現代碼熱加載, 同時又規避其中的陷阱.
