我有一個如下所示的多行字符串:
st = '''emp:firstinfo\n :secondinfo\n thirdinfo ''' print(st)
我正在嘗試做的是從我的字符串中跳過第二個':',並獲得如下所示的輸出:
'''emp:firstinfo\n secondinfo\n thirdinfo '''
簡單說,如果它以':'開頭,我只想忽略它。
這是我所做的:
mat_obj = re.match(r'(.*)\n*([^:](.*))\n*(.*)' , st) print(mat_obj.group())
顯然,我沒有看到我的錯誤,但是誰可以幫助我告訴我哪里出錯了嗎?
1 Answer:
您可以在此正則表達式中使用re.sub:
>>> print (re.sub(r'([^:\n]*:[^:\n]*\n)\s*:(.+)', r'\1\2', st)) emp:firstinfo secondinfo thirdinfo
正則表達式詳細信息:
(: 開始第一個捕獲組 [^:\n]*: 匹配0個或多個不是:的任何字符和換行符 :: 匹配冒號 [^:\n]*: 匹配0個或多個不是:的任何字符和換行符 \n: 匹配換行 ): 結束第一個捕獲組 \s*: 匹配0個或多個空格 ::匹配一個冒號 (.+): 匹配第二個捕獲組中的任何一個或多個字符(換行符除外) \1\2: 用於替換組1和2中捕獲的子字符串。
2 Answer:
您可以改用sub,只是不要捕獲不需要的部分。
(.*\n)[^:]*:(.*\n)(.*)
\1\2\3
替換為
import re regex = r"(.*\n)[^:]*:(.*\n)(.*)" test_str = ("emp:firstinfo\\n\n" " :secondinfo\\n\n" " thirdinfo") subst = "\\1\\2\\3" # You can manually specify the number of replacements by changing the 4th argument result = re.sub(regex, subst, test_str, 0, re.MULTILINE)