背景
有時,我們需要刪除Java源代碼中的注釋。目前有不少方法,比如:
-
實現狀態機。該方式較為通用,適用於多種語言(取決於狀態機支持的注釋符號)。
-
正則匹配。該方式容易誤判,尤其是容易誤刪字符串。
- 利用第三方庫。該方式局限性較強,比如不同語言可能有不同的第三方庫。
本文針對Java語言,介紹一種利用第三方庫的方式,可以方便快速地移除代碼中的注釋。
原理因此核心思路即為:
-
JavaParser解析源碼並得到AST。
-
識別出注釋類型的節點並將其刪掉。
- 將AST中剩余的節點按一定規則打印出來。
-
LineComment 單行注釋。
-
BlockComent 塊注釋。
-
JavadocComment Java文檔注釋。
import java.util.ArrayList; import java.util.stream.Collectors; /** * @author xiaoxi666 * @date 2021-02-15 17:13 * 我是 Javadoc 注釋 */ public class Input { /** * 我是 Javadoc 注釋 * * @param param1 * @param param2 */ public static void someMethod(String param1, // 我是單行注釋 String param2 // 我是單行注釋 String param3, /* 我是塊注釋 String param4, String param5, String param6 */ /* 我是塊注釋 String param4 */) { // 我是單行注釋 int a = 1; /* 我是塊注釋,注意我和Javadoc注釋的區別,我只有一個星號 */ int b = 2; /* * 我是塊注釋 */ int c = 3; String s1 = "// 我是字符串中的內容,不是注釋"; String s2 = "/* 我是字符串中的內容,不是注釋 */"; String s3 = "/** 我是字符串中的內容,不是注釋 */"; } }
我這里使用maven管理項目,首先引入JavaParser依賴:
<dependencies> <dependency> <groupId>com.github.javaparser</groupId> <artifactId>javaparser-symbol-solver-core</artifactId> <version>3.18.0</version> </dependency> </dependencies>
package core;
import com.github.javaparser.JavaParser; import com.github.javaparser.ParseResult; import com.github.javaparser.ParserConfiguration; import com.github.javaparser.ast.CompilationUnit; import com.github.javaparser.ast.Node; import com.github.javaparser.ast.comments.BlockComment; import com.github.javaparser.ast.comments.Comment; import com.github.javaparser.ast.comments.LineComment; import com.github.javaparser.printer.lexicalpreservation.LexicalPreservingPrinter; import java.util.List; import java.util.Optional; import java.util.stream.Collectors; /** * @author xiaoxi666 * @date 2021-02-15 20:09 * 幾個注釋的概念: * LineComment * BlockComment * JavadocComment */ public final class CommentsRemover { private CommentsRemover() {} public static String doAction(String content) { JavaParser javaParser = createJavaParser(); ParseResult<CompilationUnit> result = javaParser.parse(content); Optional<CompilationUnit> optionalCompilationUnit = result.getResult(); if (!optionalCompilationUnit.isPresent()) { return ""; } CompilationUnit compilationUnit = optionalCompilationUnit.get(); removeComments(compilationUnit); return LexicalPreservingPrinter.print(compilationUnit); } private static void removeComments(CompilationUnit compilationUnit) { List<Comment> comments = compilationUnit.getAllContainedComments(); List<Comment> unwantedComments = comments .stream() .filter(CommentsRemover::isValidCommentType) .collect(Collectors.toList()); unwantedComments.forEach(Node::remove); } /** * 創建源碼解析器。我們設置LexicalPreservationEnabled為true,保留源碼中的所有語法。 * * @return JavaParser */ private static JavaParser createJavaParser() { ParserConfiguration parserConfiguration = new ParserConfiguration(); parserConfiguration.setLexicalPreservationEnabled(true); return new JavaParser(parserConfiguration); } /** * 我們只識別單行注釋和塊注釋 * * @param comment * @return true if meet the correct type */ private static boolean isValidCommentType(Comment comment) { return comment instanceof LineComment || comment instanceof BlockComment; } }
IDEA插件的原理基本都是事件驅動,如下圖所示,我們創建了一個事件監聽器,當檢測到編輯器中點擊右鍵后,即可彈出菜單,我們的插件在菜單中的第一個位置。
接下來,實現事件處理器:
-
刪除源碼注釋。首先讀取當前文件內容也即源碼,然后交給前面已經介紹過的CommentsRemover.doAction處理,就拿到了刪除注釋后的源碼。
-
格式化代碼。刪除注釋后,可能會引入多余的空格,因此我們自動格式化,這樣用戶就不用再手動格式化一次了。
/** * 移除代碼中的注釋 * * @param editor * @return true if remove comments successfully */ private boolean removeComments(Editor editor) { String src = editor.getDocument().getText(); if (Strings.isNullOrEmpty(src)) { return false; } String dst = CommentsRemover.doAction(checkEndLineAndModifyIfNeed(src)); if (Strings.isNullOrEmpty(dst)) { return false; } editor.getDocument().setText(dst); return true; } /** * 由於我們保留了源碼格式,移除注釋之后會引入不必要的空格,因此需要再格式化一下 * * @param editor * @param project */ private void reformat(Editor editor, Project project) { PsiDocumentManager.getInstance(project).commitAllDocuments(); PsiFile file = PsiDocumentManager.getInstance(project).getPsiFile(editor.getDocument()); if (file == null) { return; } LastRunReformatCodeOptionsProvider provider = new LastRunReformatCodeOptionsProvider(PropertiesComponent.getInstance()); ReformatCodeRunOptions currentRunOptions = provider.getLastRunOptions(file); TextRangeType processingScope = TextRangeType.WHOLE_FILE; currentRunOptions.setProcessingScope(processingScope); (new FileInEditorProcessor(file, editor, currentRunOptions)).processCode(); }


在彈出的目錄樹中,選中remove.comments.zip安裝包,確定即可。
重啟IDEA后,可以看到插件已安裝成功:
此時我們就可以使用該插件,一鍵刪除代碼中的注釋了。演示一下效果:
不嚴格性能測試(響應時間包括插件處理時間和IDEA界面更新時間):
-
對於500行左右的文件,響應時間約200ms,幾乎瞬間完成。
-
對於1000行左右的文件,響應時間約為1s。
-
對於3000行左右的文件,響應時間約需2s。
- 對於5000行左右的文件,響應時間約需3s。
總之,日常使用毫無壓力。
總結
本文首先介紹了若干刪除注釋的手段;繼而介紹了一種利用第三方庫JavaParser刪除Java注釋的思路,並加以分析和實踐;最終將其封裝為IDEA插件,方便其他用戶使用。
另外,由於本人對JavaParser的認知不是特別深入,難免存在未考慮到的場景。若大家在使用過程中發現bug,歡迎到github提issue甚至pr。
資源
源碼均已放在github:https://github.com/xiaoxi666/remove.comments。
插件也已經上傳至github,可點擊下載。或者關注公眾號「xiaoxi666」,后台回復「刪除注釋」,即可收到插件下載地址。

Go to "Discover" > "Top Stories" > "Wow"