python匹配某個中文字符


python2.7對中文的支持不好是眾所周知的,現在遇到這樣一個需求,要匹配某個中文字符。查了一個資料,思路就是轉化為unicode進行比較,記錄如下:

line = '參考答案: A'
# gbk -> unicode
# 看需要,這里是把gbk轉化為unicode,也可以把utf-8轉換為unicode
line = line.decode('gbk').strip()

# 匹配 '參考答案' 四個字
if re.match(u'^\u53c2\u8003\u7b54\u6848', line):
   q_answer = line
   print q_answer

這就ok了.

對了,可以這樣查看中文的unicode編碼:

 


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM