用python的re(正則表達式)模塊匹配英文環境下的括號

本文轉載自查看原文 2018-09-23 21:51 8890 python/ re(正則表達式)

在用re(正則表達式)模塊匹配掉文本中的括號時，總是出現各種各樣的問題，經過將近一個小時的摸索，終於找到了問題的所在。

案例：

將 txt = 'Linux系統安裝 - 1.1(Av20994127,P1).Flv' 中的(Av20994127,P1)匹配出來，再用re.sub()去掉。

初次嘗試：

import re

txt = 'Linux系統安裝 - 1.1(Av20994127,P1).Flv' 

tx = re.search('.*?(\(.*?\)).Flv', txt)

re.sub(tx.group(1), '', txt) 
Out[1]: 'Linux系統安裝 - 1.1().Flv' # 括號()仍在，無法去掉。

解決方案：

import re

tx = re.search('.*?(\(.*?\)).Flv', txt)

re.sub('\('+tx.group(1)+'\)', '', txt)        # 在tx.group(1) 前后分別加上 '\(' 與 '\)‘
                                              # 由於才疏學淺，具體原理不明，如有高人路過，還望解答。
Out[2]: 'Linux系統安裝 - 1.1.Flv'    # 括號()被去掉。

進階：

當文本中只有一個括號(單括號)時，即：text = 'Linux系統安裝 - 1.1(Av20994127,P.Flv'

用相同的方法，出現 error: missing ), unterminated subpattern 的錯誤。

經摸索發現，解決方案如下：

import re

text = 'Linux系統安裝 - 1.1(Av20994127,P.Flv'

result = re.search('.*?(\(.*?,P),Flv', text)

new = re.sub('\\' + result.group(1), '', text) # 在result.group(1)前面加 ’\\‘

Out[3]: 'Linux系統安裝 - 1.1.Flv'

免責聲明！

本站轉載的文章為個人學習借鑒使用，本站對版權不負任何法律責任。如果侵犯了您的隱私權益，請聯系本站郵箱yoyou2525@163.com刪除。

猜您在找 python3進階之正則表達式之re模塊之分組（group）、貪心匹配、編譯正則表達式和re模塊 python中的正則表達式（re模塊）正則表達式和python的re模塊 python與正則表達式：re模塊詳解【Python】正則表達式模塊 import re詳解 re模塊正則表達式,對字符串進行模糊匹配正則表達式，匹配花括號{} 正則表達式匹配“方括號”，“雙引號” re模塊 - 正則表達式疏理(一)