Python 正则表达式匹配中文

本文转载自查看原文 2018-11-26 13:29 8310 python学习

在python2.x中，匹配中文，首先要声明utf8的编码方式。

# coding:utf-8

其次，被匹配的字符串一定要是utf8编码：

string = u'我是个好人。'

最后，正则表达式一定要是utf8编码：

pat = u'\u6211.*?\u3002'

注意，正则表达式要是u开头的utf8编码，而不是r开头的原始字符串。

完整示例：

# coding:utf-8

import re

string = u'我是个好人。'

pattern = u'\u6211.*?\u3002'

pat = re.compile(pattern)

print pat.findall(s)[0]

>>
我是个好人。

本站转载的文章为个人学习借鉴使用，本站对版权不负任何法律责任。如果侵犯了您的隐私权益，请联系本站邮箱yoyou2525@163.com删除。

猜您在找 【正则表达式】-python 正则表达式中匹配中文 Python 正则表达式匹配中文 python 正则表达式匹配中文 python正则表达式匹配中文日期时间 python 正则表达式中匹配中文 python 正则表达式匹配中文(转) python2 正则表达式匹配中文的问题正则表达式中文匹配中文正则表达式匹配-正则中文匹配中文正则表达式匹配-正则中文匹配