本文轉載自查看原文 2018-04-26 17:42 844 正則表達式/ Python

博主對此做了一些注明和修改 ^_^

像這種情況，我們就可以寫一個正則表達式先來匹配一個整個 RFC-822 頭，然后利用分組功能，使用一個組來匹配頭的名字，另一個組匹配名字對應的值。

注：RFC-822 是電子郵件的標准格式，當然到這里你還不知道分組要怎么分，不急，請接着往下看......

在正則表達式中，使用元字符 () 來划分組。() 元字符跟數學表達式中的小括號含義差不多；它們將包含在內部的表達式組合在一起，所以你可以對一個組的內容使用重復操作的元字符，例如 *，+，? 或者 {m,n} 。

例如，(ab)* 會匹配零個或者多個 ab：

使用 () 表示的子組我們還可以對它進行按層次索引，可以將索引值作為參數傳遞給這些方法：group()，start()，end() 和 span() 。序號 0 表示第一個分組（這個是默認分組，一直存在的，所以不傳入參數相當於默認值 0）：

注：有幾對小括號就是分成了幾個子組，例如 (a)(b) 和 (a(b)) 都是由兩個子組構成的。

子組的索引值是從左到右進行編號，子組也允許嵌套，因此我們可以通過從左往右來統計左括號 ( 來確定子組的序號。

group() 方法可以一次傳入多個子組的序號：

注：start() 是獲得參數子組的開始位置；end() 是獲得對應子組的結束位置；span() 是獲得對應子組的范圍。

我們還特么通過 groups() 方法一次性返回所有的子組匹配的字符串：

還有一個反向引用的概念需要介紹，反向引用指的是你可以在后面的位置使用先前匹配過的內容，用法是反斜杠加上數字。例如 \1 表示引用前邊成功匹配的序號為 1 的子組。

如果只是搜索字符串，反向引用不會被用到，因為很少有文本格式會這樣來重復字符。但是，你很快會發現，在字符串替換的時候，反向引用是非常有用的（深井水）！

注：注意，在 Python 的字符串中會使用反斜杠加數字的方式來表示數字的值對應的 ASCII 字符，所以在使用反向索引的正則表達式中，我們依然強調要使用原始字符串。

(本文完)

如果你喜歡這篇文章，請通過下方「評分」給我鼓勵哦 ^_^

本站轉載的文章為個人學習借鑒使用，本站對版權不負任何法律責任。如果侵犯了您的隱私權益，請聯系本站郵箱yoyou2525@163.com刪除。

猜您在找 Python3 如何優雅地使用正則表達式（詳解四） Python3 如何優雅地使用正則表達式（詳解二） Python3 如何優雅地使用正則表達式（詳解一）詳解 Python3 正則表達式（一） Python3 正則表達式 Python3 正則表達式 python3 正則表達式 python3之正則表達式 Python3正則表達式 Python正則表達式詳解

更多強大的功能

分組