富文本中文字部分提取

本文轉載自查看原文 2020-11-05 09:04 528 Java

//富文本編輯器內的內容保存到數據庫后是一段html代碼，先因某些需求需要去掉其中的樣式等內容，只保留文字，代碼如下：
public class HtmlToText extends HTMLEditorKit.ParserCallback {
    private static HtmlToText html2Text = new HtmlToText();
    StringBuffer stringBuffer;
    private HtmlToText() {
    }
    public void parse(String str) throws IOException {
        InputStream iin = new ByteArrayInputStream(str.getBytes());
        Reader in = new InputStreamReader(iin);
        stringBuffer = new StringBuffer();
        ParserDelegator delegator = new ParserDelegator();
        delegator.parse(in, this, Boolean.TRUE);
        iin.close();
        in.close();
    }
    public void handleText(char[] text, int pos) {
        stringBuffer.append(text);
    }
    public String getText() {
        return stringBuffer.toString();
    }
    public static String getContent(String str) {
        try {
            html2Text.parse(str);
        } catch (IOException e) {
            e.printStackTrace();
        }
        return html2Text.getText();
    }
    public static void main(String[] args) {
        String text = HtmlToText.getContent("你的富文本字符串");
        System.out.println(text);
    }
}

免責聲明！

本站轉載的文章為個人學習借鑒使用，本站對版權不負任何法律責任。如果侵犯了您的隱私權益，請聯系本站郵箱yoyou2525@163.com刪除。

猜您在找 如何用正則提取中文字符 css中文字超出文本框，溢出部分用點點點表示防止識別圖片中文字；防止圖片文字提取；反抗圖片文字提取 python提取url中的所有中文字符提取圖片中文字方法 Python只讀取文本中文字符 android textview改變部分文字的顏色和string.xml中文字的替換（轉）使用sfntly中的sfnttool.jar提取中文字體 Oracle提取中文字符串拼音首字母函數 word沒有中文字號