判断文件的编码 python


import chardet
import string
path1= r'C:\Users\25456\Desktop'
path = path1 + r'\深度学习.txt'
with open(path, 'rb') as f:
    data = f.read()
    f_charInfo=chardet.detect(data)
    print (f_charInfo)


 输出:{'encoding': 'GB2312', 'language': 'Chinese', 'confidence': 0.99}

 

其中:encoding表示编码,confidence表示置信度,即判断文件0.99的可能性为GB2312编码

然后就可以正常读取文件,不会出现乱码了:

with open(path, 'rb') as f:
    result = f.read()
    result = result.decode(encoding='GB2312')
    print (result)

 


免责声明!

本站转载的文章为个人学习借鉴使用,本站对版权不负任何法律责任。如果侵犯了您的隐私权益,请联系本站邮箱yoyou2525@163.com删除。



 
粤ICP备18138465号  © 2018-2025 CODEPRJ.COM