python2.7對中文的支持不好是眾所周知的,現在遇到這樣一個需求,要匹配某個中文字符。查了一個資料,思路就是轉化為unicode進行比較,記錄如下:
line = '參考答案: A' # gbk -> unicode # 看需要,這里是把gbk轉化為unicode,也可以把utf-8轉換為unicode line = line.decode('gbk').strip() # 匹配 '參考答案' 四個字 if re.match(u'^\u53c2\u8003\u7b54\u6848', line): q_answer = line print q_answer
這就ok了.
對了,可以這樣查看中文的unicode編碼: