判斷文件的編碼 python


import chardet
import string
path1= r'C:\Users\25456\Desktop'
path = path1 + r'\深度學習.txt'
with open(path, 'rb') as f:
    data = f.read()
    f_charInfo=chardet.detect(data)
    print (f_charInfo)


 輸出:{'encoding': 'GB2312', 'language': 'Chinese', 'confidence': 0.99}

 

其中:encoding表示編碼,confidence表示置信度,即判斷文件0.99的可能性為GB2312編碼

然后就可以正常讀取文件,不會出現亂碼了:

with open(path, 'rb') as f:
    result = f.read()
    result = result.decode(encoding='GB2312')
    print (result)

 


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM