今天一個問題困擾了我一段時間,就是有關python2讀取文件中含有中文的文字片段 讀取過程中會亂碼,分享一下文件內容,如下圖所示:
分享一下讀取的代碼如下:
file_path = r'D:\test\mtcnn_asian1.txt' file_name = open(file_path, 'r').readlines() for i in file_name: print i
讀取結果如下:
face_data\����������\���Ӿ�\0_0.jpg
face_data\����������\���Ӿ�\102_0.jpg
�����ף����
發現全是亂碼了,不管我一頓捯飭,基本上所有的的編碼格式都用了,結果還是出不來中文,你可以自己試試吧,我這里直接分享我正確的解析代碼,如下圖:
file_path = r'D:\test\mtcnn_asian1.txt' file_name = open(file_path, 'r').readlines() for i in file_name: print i.decode("gb2312")
讀取結果如下:
face_data\華人男明星\丁子峻\0_0.jpg
face_data\華人男明星\丁子峻\102_0.jpg
祖國我祝福你
果然是一頓操作猛如虎 到最后原來這么簡單的問題,果然是自己 low low 呀