如何在python中使用正則表達式從多行字符串中刪除特定字符



我有一個如下所示的多行字符串:

st = '''emp:firstinfo\n
       :secondinfo\n
       thirdinfo
     '''
print(st)

  

我正在嘗試做的是從我的字符串中跳過第二個':',並獲得如下所示的輸出:

 

'''emp:firstinfo\n
   secondinfo\n
   thirdinfo
   '''

  

簡單說,如果它以':'開頭,我只想忽略它。

 

這是我所做的:

mat_obj = re.match(r'(.*)\n*([^:](.*))\n*(.*)' , st)
print(mat_obj.group())

  顯然,我沒有看到我的錯誤,但是誰可以幫助我告訴我哪里出錯了嗎?


1 Answer:


您可以在此正則表達式中使用re.sub:

>>> print (re.sub(r'([^:\n]*:[^:\n]*\n)\s*:(.+)', r'\1\2', st))
emp:firstinfo
secondinfo

       thirdinfo

  
正則表達式詳細信息:

(: 開始第一個捕獲組
[^:\n]*: 匹配0個或多個不是:的任何字符和換行符
:: 匹配冒號
[^:\n]*: 匹配0個或多個不是:的任何字符和換行符
\n: 匹配換行
): 結束第一個捕獲組
\s*: 匹配0個或多個空格
::匹配一個冒號
(.+): 匹配第二個捕獲組中的任何一個或多個字符(換行符除外)
\1\2: 用於替換組1和2中捕獲的子字符串。

 2 Answer:


您可以改用sub,只是不要捕獲不需要的部分。

(.*\n)[^:]*:(.*\n)(.*)

  

 

\1\2\3

  

 替換為

import re

regex = r"(.*\n)[^:]*:(.*\n)(.*)"

test_str = ("emp:firstinfo\\n\n"
    "       :secondinfo\\n\n"
    "       thirdinfo")

subst = "\\1\\2\\3"

# You can manually specify the number of replacements by changing the 4th argument
result = re.sub(regex, subst, test_str, 0, re.MULTILINE)

  

 


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM