使用正則表達式匹配 HTML 標簽內的內容

本文轉載自查看原文 2022-04-07 19:13 1233 JavaScript的使用

使用正則表達式匹配 HTML 標簽內的內容

正則表達式如下

/(?<=((<[a-zA-Z-]+?){0,1}>))([\s\S]+)(?=([\s]{0,1}<\/[a-zA-Z-]+(>{0,1})))/g

測試例子：

var regexp = /(?<=((<[a-zA-Z-]+?){0,1}>))([\s\S]+)(?=([\s]{0,1}<\/[a-zA-Z-]+(>{0,1})))/g

// （以下都是常見的格式化后的代碼）

// 例子1
var str1 = `<div>hello</div>`
console.log(str1.match(regexp))
// ['hello']

// 例子2
var str2 = `<div>
  hello
</div>`
console.log(str2.match(regexp))
// ['\n  hello\n']

// 例子3
var str3 = `<div
>hello</div>`
console.log(str3.match(regexp))
// ['hello']

// 例子4
var str4 = `<div
>hello</div
>`
console.log(str4.match(regexp))
// ['hello']

// 例子5
var str5 = `<div
  class="test"
  id="test"
  onClick="fns"
>
  hello
</div>`
console.log(str5.match(regexp))
// ['\n  hello\n']

介紹

其中，這個正則表達式分為三個部分

(?<=((<[a-zA-Z-]+?){0,1}>))
([\s\S]+)
(?=([\s]{0,1}<\/[a-zA-Z-]+(>{0,1})))

第一部分用來匹配 開始標簽 或者 換行的開始標簽的最后一個字符 >
第二部分就是標簽內的內容
第三部分是標簽的 結束標簽 或者 </ 加標簽名

第一部分 (?<=y)x 和第三部分 x(?=y) 用到了零寬斷言，感興趣的可以看這里正則表達式零寬斷言

最后

vscode里面使用正則表達式搜索的話，可以把零寬斷言去掉，即：

(((<[a-zA-Z-]+?){0,1}>))([\s\S]+)(([\s]{0,1}<\/[a-zA-Z-]+(>{0,1})))

免責聲明！

本站轉載的文章為個人學習借鑒使用，本站對版權不負任何法律責任。如果侵犯了您的隱私權益，請聯系本站郵箱yoyou2525@163.com刪除。

猜您在找 使用正則表達式匹配正則表達式匹配a標簽或div標簽 (轉)PHP正則表達式匹配嵌套HTML標簽的方法和技巧正則表達式匹配連續多個相同內容匹配網頁HTML元素的正則表達式 Java中正則表達式去除html標簽正則表達式過濾html標簽正則表達式—從HTML里提取內容 Python 使用正則表達式匹配URL網址 idea 使用正則表達式進行匹配替換

使用正則表達式 匹配 HTML 標簽內的內容

使用正則表達式 匹配 HTML 標簽內的內容

正則表達式如下

測試例子：

介紹

最后

免責聲明！

使用正則表達式匹配 HTML 標簽內的內容

使用正則表達式匹配 HTML 標簽內的內容