Python 正則表達式匹配中文

本文轉載自查看原文 2018-11-26 13:29 8310 python學習

在python2.x中，匹配中文，首先要聲明utf8的編碼方式。

# coding:utf-8

其次，被匹配的字符串一定要是utf8編碼：

string = u'我是個好人。'

最后，正則表達式一定要是utf8編碼：

pat = u'\u6211.*?\u3002'

注意，正則表達式要是u開頭的utf8編碼，而不是r開頭的原始字符串。

完整示例：

# coding:utf-8

import re

string = u'我是個好人。'

pattern = u'\u6211.*?\u3002'

pat = re.compile(pattern)

print pat.findall(s)[0]

>>
我是個好人。

本站轉載的文章為個人學習借鑒使用，本站對版權不負任何法律責任。如果侵犯了您的隱私權益，請聯系本站郵箱yoyou2525@163.com刪除。

猜您在找 【正則表達式】-python 正則表達式中匹配中文 Python 正則表達式匹配中文 python 正則表達式匹配中文 python正則表達式匹配中文日期時間 python 正則表達式中匹配中文 python 正則表達式匹配中文(轉) python2 正則表達式匹配中文的問題正則表達式中文匹配中文正則表達式匹配-正則中文匹配中文正則表達式匹配-正則中文匹配