Python讀取文件中的字符串已經是unicode編碼,如:\u53eb\u6211,需要轉換成中文時有兩種方式
1.使用eval:
eval("u"+"\'"+unicodestr+"\'")
2.使用decode:
str1 = '\u4f60\u597d' print str1.decode('unicode_escape') 你好
unicodestr.decode('unicode_escape') # 將轉義字符\u讀取出來
# ’\u’開頭就基本表明是跟unicode編碼相關的,“\u”后的16進制字符串是相應漢字的utf-16編碼。Python里decode()和encode()為我們提供了解碼和編碼的方法。其中decode('unicode_escape')能將此種字符串解碼為unicode字符串。