python正則表達式(7)--flag修飾符、match對象屬性


正則表達式—修飾符

正則表達式可以包含一些標志修飾符來控制匹配模式,用在正則表達式處理函數中的flag參數中,為可選參數。

(1) re.I 全寫(re.IGNORECASE)

表示使匹配時,忽略大小

(2) re.M 全寫(re.MULTILINE)

多行匹配,影響 ^ 和 $的行為

(3) re.S 全寫(re.DOTALL)

使點(.)匹配包括換行在內的所有字符

(4) re.X 全寫(re.VERBOSE)

這個模式下正則表達式可以是多行,忽略空白字符,並可以加入注釋。

(5) 除以上標志外還有re.L和re.U,但不常用

(6) 可以通過使用運算符“|“來指定多個標志,表示同時生效。

如: re.I | re.M被設置成I和M標志,

content = 'My username is zeke999!'

re.search(r'zeke\d{3}', content, re.I | re.M)

 

Match對象的屬性

(1)string 屬性:

獲取匹配時使用的字符串對象

>>> m = re.match(r'\d+','456abc')

>>> m.string

'456abc'

 

(2)re 屬性:

匹配時使用的pattern對象,也就是匹配到內容的正則表達 式對象

>>> m

<_sre.SRE_Match object at 0x02C8FA68>

>>> m.re

<_sre.SRE_Pattern object at 0x02D4ECD0>

 

(3)pos屬性:

該屬性表示文本中正則表達式開始搜索的索引。值與Pattern.match()和Pattern.seach()方法中的同名參數相同

>>> m.pos

0

 

(4)endpos屬性:

該屬性表示文本中正則表達式結束搜索的索引。值與Pattern.match()和 Pattern.seach()方法中的同名參數相同

>>> m.endpos

6

 

(5)lastindex屬性:

該屬性表示最后一個被捕獲的分組在文本中的索引。如果沒有被捕獲的分組,將為None

>>> m = re.match(r'a(b)(c)d','abcdef')

>>> m.lastindex

2

 

(6)lastgroup屬性:

該屬性表示最后一個被捕獲的分組別名。如果這個分 組沒有別名或者沒有被捕獲的分組,將為None。

 

(7)group([group1, ...]):

獲得一個或多個分組截獲的字符串;指定多個參數時將以元組形式返回。group1可以使用編 號也可以使用別名;編號0代表匹配的整個子串;默認返回group(0)

實例:group函數傳多個參數

p = re.compile('(a(b)c)d')

m = p.match('abcd')

resTup = m.group(1,2,1)

print resTup

>>>('abc', 'b', 'abc')

 

(8)groups([default=None])

以元組形式返回全部分組截獲的字符串。相當於調用group(1,2,…last)

 

(9)start([group=0])

返回指定的組截獲的子串在string中的起始索引(子串第一個字符的索引)。默認為第0組,即整個字符串

 

(10)end([group=0])

返回指定的組截獲的子串在string中的結束索引(子串最后一個字符的索引)。group默認值 為0,即整個字符串

 

(11)span([group])

該方法表示以元組的形式返回 (start(group), end(group)),即某個分組的匹配文字內容在被 匹配字符串的開始索引位置和結束索引位置

 

(12)expand(template)

將匹配到的分組代入template中然后返回。template中可以使用\id或\g<id>、\g<name> 引用分組,但不能使用編號0。\id與\g<id>是等價的;但\10將被認為是第10個分組,如果 你想表達\1之后是字符'0',只能使用\g<1>0。

m = re.search(r'(\w+)! (\w+) (\w+)','HMan! How finny!') #將匹配的結果帶入 print m.expand(r'resut:\3 \2 \1')  

>>> resut:finny How HMan

 

(13)groupdict([default=None])

該函數的作用是,將所有匹配到並且指定了別名的分組,以別名為key,匹配到的字串為value, 存於字典中,然后返回這個字典。如果表達式中未設置別名分組,就會返回一個空字典

>>> m = re.search(r'(?P<num>\d+)(\w+)','78fd')

>>> m.groupdict()

{'num': '78'}

 


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM