正则表达式,从富文本中提取纯文本


Java 使用正则表达式,从HTML富文本中提取纯文本。

public class demo {

    /**
     * 富文本提取纯文本
     * @param inputStr
     * @return
     */
    private static String htmlTagFilter(String inputStr) {
        if (inputStr == null || "".equals(inputStr.trim())) {
            return "";
        }
        String outStr = inputStr.replaceAll("\\&[a-zA-Z]{1,10};", "")
                .replaceAll("<[a-zA-Z]+[1-9]?[^><]*>", "")
                .replaceAll("</[a-zA-Z]+[1-9]?>", "")
                .replaceAll("\\s*|\t|\r|\n", "");
        return outStr;
    }

    public static void main(String[] args) {
        System.out.println(
            htmlTagFilter("<p>\n" +
                "\t<span style=\"font-family:&quot;font-size:18px;\">在电影院开展观影活动。</span>\n" +
                "</p>\n" +
                "<p>\n" +
                "\t<span style=\"font-family:&quot;font-size:18px;\"><span style=\"font-family:&quot;font-size:18px;\">在欢乐的气氛中,愉快地度过节日。</span></span>\n" +
                "</p>\n" +
                "<p>\n" +
                "\t<span style=\"font-family:&quot;font-size:18px;\"><img src=\"/admin/kindEditorPath/image/2022-03-02/c3d3e616032d4760b6a5e02fe5c538f6.jpg\" alt=\"\" /><br />\n" +
                "</span>\n" +
                "</p>")
        );
    }

}

输出结果:在电影院开展观影活动。在欢乐的气氛中,愉快地度过节日。

 

心灵笔记:

孩子问我,上班和上学哪一个更辛苦,这让我也不知道该如何回答。

直到我见到一群干着辛苦工作,却有说有笑的人们,我才知道,

不高兴了最辛苦!


免责声明!

本站转载的文章为个人学习借鉴使用,本站对版权不负任何法律责任。如果侵犯了您的隐私权益,请联系本站邮箱yoyou2525@163.com删除。



 
粤ICP备18138465号  © 2018-2025 CODEPRJ.COM