正则表达式:r'([1]+(?:\s[a-zA-Z]+)+)(?=[\u4e00-\u9fa5])'
替换字符串:‘{\1},,’
匹配字符串:quite a few相当多
替换结果:{quite a few},,相当多
替换时反向引用要额外增加条反斜杠,对\1进行转义“\1”
以上的内容在文件软件中操作正常的,但是在处理文本文件时不成功,最后的解决方案是把^换成\n才成功了。
content = re.sub(r'(\n[a-zA-Z]+(?:\s[a-zA-Z]+)+)(?=[\u4e00-\u9fa5])', '\1,', content)
a-zA-Z ↩︎