1)正則表達式含義
. # 點可代表一切字符
\ # 起轉義作用
[...] # 指代方括號中的任意字符
\d # 指代數字0-9
\D # 指代非數字
\s # 指代一切空格,包括tab制表符、空格、換行等
\S # 指代非空格
\w # 指代大小寫字母、數字和下划線
\W # 指代非大小寫字母、數字和下划線
* # 匹配前面字符 >=0 次
+ # 匹配前面字符1次及以上
? # 匹配前面字符0次或1次
{m} # 匹配m次
{m,n} # 匹配m到n次
{m,} # 至少匹配m次
2)結合re模塊完成字符串的匹配
找
re.findall(pattern, string, flags=0)
pattern-->正則表達式
string-->需要處理的字符串
flags-->說明匹配模式,如是否大小寫re.I
注:findall不同的表現形式:
-
import re第一種
-
kk = re.compile( r'\d+')
-
kk.findall( 'one1two2three3four4')
-
#[1,2,3,4]第二種
-
#注意此處findall()的用法,可傳兩個參數;
-
kk = re.compile( r'\d+')
-
re.findall(kk, "one123")第三種kk = "one123"re.findall(r'\d+', kk)
切
re.split(pattern, string, maxsplit=0, flags=0)
pattern-->正則表達式
string-->需要處理的字符串
maxsplit-->最大匹配次數。0表示匹配所有次
替
sub(pattern, repl, string, count=0, flags=0)
pattern-->正則表達式
repl-->新的替換內容
string-->需要處理的字符串
count-->替換次數。0表示匹配替換所有次
flags-->匹配模式