1. re.match 嘗試從字符串的起始位置匹配一個模式,如果不是起始位置匹配成功的話,match()就返回none。
|
1
2
3
4
|
import
re
line
=
"this hdr-biz 123 model server 456"
pattern
=
r
"123"
matchObj
=
re.match( pattern, line)
|
2. re.search 掃描整個字符串並返回第一個成功的匹配。
|
1
2
3
4
|
import
re
line
=
"this hdr-biz model server"
pattern
=
r
"hdr-biz"
m
=
re.search(pattern, line)
|
3. Python 的re模塊提供了re.sub用於替換字符串中的匹配項。
|
1
2
3
4
|
import
re
line
=
"this hdr-biz model args= server"
patt
=
r
'args='
name
=
re.sub(patt, "", line)
|
4. compile 函數用於編譯正則表達式,生成一個正則表達式( Pattern )對象,供 match() 和 search() 這兩個函數使用。
|
1
2
|
import
re
pattern
=
re.
compile
(r
'\d+'
)
|
5. re.findall 在字符串中找到正則表達式所匹配的所有子串,並返回一個列表,如果沒有找到匹配的,則返回空列表。
|
1
2
3
4
5
|
import
re
line
=
"this hdr-biz model args= server"
patt
=
r
'server'
pattern
=
re.
compile
(patt)
result
=
pattern.findall(line)
|
6. re.finditer 和 findall 類似,在字符串中找到正則表達式所匹配的所有子串,並把它們作為一個迭代器返回。
|
1
2
3
4
|
import
re
it
=
re.finditer(r
"\d+"
,
"12a32bc43jf3"
)
for
match
in
it:
print
(match.group() )
|
PS:Python字符串匹配及正則表達式說明
解析url地址正則表達式:
|
1
2
3
4
5
6
7
8
9
10
11
|
regexp
=
(r
'^(?P<scheme>[a-z][\w\.\-\+]+)?:(//)?'
r
'(?:(?P<username>\w+):(?P<password>[\w\W]+)@|)'
r
'(?P<domain>[\w-]+(?:\.[\w-]+)*)(?::(?P<port>\d+))?/?'
r
'(?P<path>\/[\w\.\/-]+)?(?P<query>\?[\w\.*!=&@%;:/+-]+)?'
r
'(?P<fragment>#[\w-]+)?$'
)
match
=
re.search(regexp, url.strip(), re.U)
if
match
is
None
:
raise
ValueError(
'Incorrent url: {0}'
.
format
(url))
url_parts
=
match.groupdict()
print
(url_parts):{
'scheme'
:
'https'
,
'username'
:
None
,
'password'
:
None
,
'domain'
:
'blog.csdn.net'
,
'port'
:
None
,
'path'
:
'/weixin_40907382/article/明細/79654372'
,
'query'
:
None
,
'fragment'
:
None
}
|
總結
以上所述是小編給大家介紹的Python字符串匹配之6種方法的使用,希望對大家有所幫助,如果大家有任何疑問請給我留言,小編會及時回復大家的。在此也非常感謝大家對腳本之家網站的支持!
