Python正則表達式中的re.S


title: Python正則表達式中的re.S
date: 2014-12-21 09:55:54
categories: [Python]
tags: [正則表達式,python]

在Python的正則表達式中,有一個參數為re.S。它表示“.”(不包含外側雙引號,下同)的作用擴展到整個字符串,包括“\n”。看如下代碼:

import re
a = '''asdfsafhellopass:
	234455
	worldafdsf
	'''
b = re.findall('hello(.*?)world',a)
c = re.findall('hello(.*?)world',a,re.S)
print 'b is ' , b
print 'c is ' , c

運行結果如下:

b is  []
c is  ['pass:\n\t234455\n\t']

正則表達式中,“.”的作用是匹配除“\n”以外的任何字符,也就是說,它是在一行中進行匹配。這里的“行”是以“\n”進行區分的。a字符串有每行的末尾有一個“\n”,不過它不可見。

如果不使用re.S參數,則只在每一行內進行匹配,如果一行沒有,就換下一行重新開始,不會跨行。而使用re.S參數以后,正則表達式會將這個字符串作為一個整體,將“\n”當做一個普通的字符加入到這個字符串中,在整體中進行匹配。

在re.py庫的介紹中有以下語句:

"." Matches any character except a newline.

S DOTALL "." matches any character at all, including the newline.

這里特別感謝評論中叫做Style的朋友指出了我的錯誤。


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM