其實從html富文本中提取純文本很簡單,富文本基本上是使用html標簽給文本加上豐富多彩的樣式。
所以只需要將富文本字符串中的“<.....>”標簽剔除,即可得到純文本。我們可以使用正則表達式,來匹配所有的html標簽,並替換成空字符,如下:
//html剔除富文本標簽,留下純文本
function getSimpleText(html){
var re1 = new RegExp("<.+?>","g");//匹配html標簽的正則表達式,"g"是搜索匹配多個符合的內容
var msg = html.replace(re1,'');//執行替換成空字符
return msg;
}
java:
str = str.replaceAll("<.+?>", "");
------------------------------------
原文地址:
