python正則表達式(8)--分組、后向引用、前(后)向斷言

本文轉載自查看原文 2018-09-06 12:21 2090 python/ 正則表達式

無名、有名分組

(1)正則表達式—無名分組

從正則表達式的左邊開始看，看到的第一個左括號“(”表示表示第一個分組，第二個表示第二個分組，依次類推。

需要注意的是，有一個隱含的全局分組（就是索引號為0的分組），就是整個正則表達式匹配的結果

(2)正則表達式—有名分組

命名分組就是給具體有默認分組編號的組另外再起一個別名，方便以后的引用。命令分組的語法格式如下： (?P<name>正則表達式)

語法格式中的字符P必須是大寫的“P”，name是一個合法的標識符，表示分組的別名。

s = "ip='230.192.168.78',version='1.0.0'"

res = re.search(r"ip='(?P<ip>\d+\.\d+\.\d+\.\d+).*", s)

print res.group('ip')#通過命名分組引用分組

正則表達式—后向引用

當用“()”定義了一個正則表達式分組后，正則引擎就會把匹配的組按照順序進行編號，然后存入緩存中。這樣我們就可以在后面對已經匹配過的內容進行引用，這就叫后向引用。

(1)通過索引引用

\數字 \1表示引用第一個分組，\2引用第二個分組，以此類推，\n引用第n個組，而\0則表示引用整個被匹配的正則表達式本身。

交換字符串的位置

import re

s = 'abc.xyz' # 交換.號兩邊的字符串

res = re.sub(r'(.*)\.(.*)', r'\2.\1', s)

print res

>>>xyz.abc

(2) (?P=name)通過命名分組名進行引用

(?P=name) 字符P必須是大寫的P，name表示命名分組的分組名

(?P<name>)(?P=name) 引用分組的值匹配值必須與第一個分組匹配值相等才能匹配到

例如：

1) 引用前一個分組，前后值相同都是2，故能匹配到

>>> re.match(r'(?P<xst>\d)(?P=xst)','22').groups()

('2',)

>>> re.match(r'(?P<xst>\d)(?P=xst)','22').group()

'22'

2) 引用前一個分組，前后值不相同分別為2和3，故不能匹配到

>>> re.match(r'(?P<xst>\d)(?P=xst)','23').group()

Traceback (most recent call last):

File "<stdin>", line 1, in <module>

AttributeError: 'NoneType' object has no attribute 'group'

正則表達式—前后向斷言

(1)前向肯定斷言與后向肯定斷言

1) 前向肯定斷言的語法：

(?<=pattern) 前向肯定斷言表示你希望匹配的字符串前面是pattern匹配的內容時，才匹配。

2) 后向肯定斷言的語法：

(?=pattern) 后向肯定斷言表示你希望匹配的字符串的后面是pattern匹配的內容時，才匹配

3)前后向斷言同時使用

如果在一次匹配過程中，需要同時用到前向肯定斷言和后向肯定斷言時，那你必須將前向肯定斷言表達式寫在要匹配的正則表達式的前面，而后向肯定斷言表達式寫在你要匹配的字符串的后面

(2) 前向否定斷言與后向否定斷言

1) 前向否定斷言的語法：

(?<!pattern) 前向否定斷言表示你希望匹配的字符串的前面不是pattern匹配的內容時，才匹配.

2) 后向否定斷言的語法:

(?!pattern) 后向否定斷言表示你希望匹配的字符串后面不是pattern匹配的內容時，才匹配。

(3)注意

前向肯定（否定）斷言括號中的正則表達式必須是能確定長度的正則表達式，比如\w{3}，而不能寫成 \w*或者\w+或者\w?等這種不能確定個數的正則模式符。

免責聲明！

本站轉載的文章為個人學習借鑒使用，本站對版權不負任何法律責任。如果侵犯了您的隱私權益，請聯系本站郵箱yoyou2525@163.com刪除。

猜您在找 $python正則表達式系列（4）——分組和后向引用正則表達式之后向引用正則表達式：引用分組正則表達式分組()、不捕獲(?:)和斷言(?<=)詳解正則表達式分組、斷言詳解 Python 正則表達式（分組） Python 正則表達式（分組） Python 正則表達式分組 python 之re模塊（正則表達式）分組、斷言詳解正則表達式入門（四）選擇，分組和向后引用