題目
字符串 s="hello 1234 world xx 上海 18 悠悠",用正則過濾掉英文和數字
得到:上海 悠悠
sub 過濾
re正則表達式中,過濾字符可以用替換的方法,用sub查找替換字符
import re
s = "hello 1234 world xx 上海 18 悠悠"
r = re.sub('[a-zA-Z0-9]', '', s)
print(r.strip())
運行結果:上海 悠悠
sub是查找替換,找到英文和數字[a-zA-Z0-9]
,替換成空字符,替換后首位會有空格
去掉首尾空格用 python 里面的 strip() 方法
詳情參考這篇https://www.cnblogs.com/yoyoketang/p/14261349.html
正則提取中文
如果是正則提取字符串中的中文,可以匹配中文[\u4e00-\u9fa5]
s = "hello 1234 world xx 上海 18 悠悠"
r = re.findall(r'[\u4e00-\u9fa5]+', s)
print(" ".join(r))
運行結果:上海 悠悠