一、正則表達式分組的概念
正則表達式的分組能夠將子表達式做成子集,使用()進行分組,方便對match的字符串進行划分。
二、正則表達式分組的命名方式
分組的命名方式為:(?<groupname> exp)
另外還有一種方式,我們可以匹配exp,但是不捕獲匹配的文本,也不分配組號,可以通過:(?:exp)
這里提一下,匹配內容的時候,有兩種模式,一種是貪婪(盡可能多的匹配內容 --> .* )。,另外一種是懶惰(盡可能少的匹配內容,即匹配任意數量的重復,但是在能使整個匹配成功的前提下,使用最少的重復 --> .*? ):
這里舉個例子:
- a.*b 匹配內容:aabab --> 匹配結果:aabab
- a.*?b 匹配內容:aabab --> 匹配結果:aab
下面的表格是其他情況的懶惰的匹配規則語法及說明:
三、實例:使用正則表達式分組獲取百度頁面的內容標題