import re str=''' 漢字文字 1234567890 abcdefghijklmnopqrstuvwxyz -_+=!@#$%^&*()[]{};:"'<>,.?/|~ ` ''' ret = re.findall('[\u4e00-\u9fa5]',str) # 匹配中文字符(雙字節字符),漢字、中文標點符號 # ret = re.findall('[^\x00-\xff]',str) print(ret) print(''.join(ret))
輸出結果:
小結:
匹配漢字文字:
[\u4e00-\u9fa5]
匹配非漢字字符:
[^\u4e00-\u9fa5]
匹配雙字節字符(漢字、中文標點符號等):
[^\x00-\xff]