Python字符串匹配之6種方法的使用詳解


1. re.match 嘗試從字符串的起始位置匹配一個模式,如果不是起始位置匹配成功的話,match()就返回none。

1
2
3
4
import re
line = "this hdr-biz 123 model server 456"
pattern = r "123"
matchObj = re.match( pattern, line)

2. re.search 掃描整個字符串並返回第一個成功的匹配。

1
2
3
4
import re
line = "this hdr-biz model server"
pattern = r "hdr-biz"
m = re.search(pattern, line)

3. Python 的re模塊提供了re.sub用於替換字符串中的匹配項。

1
2
3
4
import re
line = "this hdr-biz model args= server"
patt = r 'args='
name = re.sub(patt, "", line)

4. compile 函數用於編譯正則表達式,生成一個正則表達式( Pattern )對象,供 match() 和 search() 這兩個函數使用。

1
2
import re
pattern = re. compile (r '\d+' )

5. re.findall 在字符串中找到正則表達式所匹配的所有子串,並返回一個列表,如果沒有找到匹配的,則返回空列表。

1
2
3
4
5
import re
line = "this hdr-biz model args= server"
patt = r 'server'
pattern = re. compile (patt)
result = pattern.findall(line)

6. re.finditer 和 findall 類似,在字符串中找到正則表達式所匹配的所有子串,並把它們作為一個迭代器返回。

1
2
3
4
import re
it = re.finditer(r "\d+" , "12a32bc43jf3" )
for match in it:
  print (match.group() )

PS:Python字符串匹配及正則表達式說明 

解析url地址正則表達式:

1
2
3
4
5
6
7
8
9
10
11
regexp = (r '^(?P<scheme>[a-z][\w\.\-\+]+)?:(//)?'
      r '(?:(?P<username>\w+):(?P<password>[\w\W]+)@|)'
      r '(?P<domain>[\w-]+(?:\.[\w-]+)*)(?::(?P<port>\d+))?/?'
      r '(?P<path>\/[\w\.\/-]+)?(?P<query>\?[\w\.*!=&@%;:/+-]+)?'
      r '(?P<fragment>#[\w-]+)?$' )
match = re.search(regexp, url.strip(), re.U)
if match is None :
   raise ValueError( 'Incorrent url: {0}' . format (url))
url_parts = match.groupdict()
print (url_parts):{ 'scheme' : 'https' , 'username' : None , 'password' : None , 'domain' : 'blog.csdn.net' , 'port' : None , 'path' : '/weixin_40907382/article/明細/79654372' , 'query' : None , 'fragment' : None }

總結

以上所述是小編給大家介紹的Python字符串匹配之6種方法的使用,希望對大家有所幫助,如果大家有任何疑問請給我留言,小編會及時回復大家的。在此也非常感謝大家對腳本之家網站的支持!


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM