title: Python正則表達式中的re.S
date: 2014-12-21 09:55:54
categories: [Python]
tags: [正則表達式,python]
在Python的正則表達式中,有一個參數為re.S。它表示“.”(不包含外側雙引號,下同)的作用擴展到整個字符串,包括“\n”。看如下代碼:
import re
a = '''asdfsafhellopass:
234455
worldafdsf
'''
b = re.findall('hello(.*?)world',a)
c = re.findall('hello(.*?)world',a,re.S)
print 'b is ' , b
print 'c is ' , c
運行結果如下:
b is []
c is ['pass:\n\t234455\n\t']
正則表達式中,“.”的作用是匹配除“\n”以外的任何字符,也就是說,它是在一行中進行匹配。這里的“行”是以“\n”進行區分的。a字符串有每行的末尾有一個“\n”,不過它不可見。
如果不使用re.S參數,則只在每一行內進行匹配,如果一行沒有,就換下一行重新開始,不會跨行。而使用re.S參數以后,正則表達式會將這個字符串作為一個整體,將“\n”當做一個普通的字符加入到這個字符串中,在整體中進行匹配。
在re.py庫的介紹中有以下語句:
"." Matches any character except a newline.
S DOTALL "." matches any character at all, including the newline.
這里特別感謝評論中叫做Style的朋友指出了我的錯誤。