正則表達式:r'([1]+(?:\s[a-zA-Z]+)+)(?=[\u4e00-\u9fa5])'
替換字符串:‘{\1},,’
匹配字符串:quite a few相當多
替換結果:{quite a few},,相當多
替換時反向引用要額外增加條反斜杠,對\1進行轉義“\1”
以上的內容在文件軟件中操作正常的,但是在處理文本文件時不成功,最后的解決方案是把^換成\n才成功了。
content = re.sub(r'(\n[a-zA-Z]+(?:\s[a-zA-Z]+)+)(?=[\u4e00-\u9fa5])', '\1,', content)
a-zA-Z ↩︎