Python讀取各種格式的txt文檔(ANSI、Unicode、Unicode big endian、UTF-8等)


import chardet #導入chardet庫
'''
1.推薦地址: http://download.csdn.net/download/aqwd2008/4256178 
2.官方地址: http://pypi.python.org/pypi/chardet
如果采用源代碼安裝方法,有可能會提示缺少setuptools這個模塊。
因此這里我們采用另外一種更為方便的安裝方法,不論你選擇哪種安裝包,
將它解壓得到其中的文件夾【chardet】將這個文件夾復制到
【python安裝根目錄\Lib\site-packages】下,確保這個位置可以被python引用到。
如果不能被引用到請加入環境變量。
'''   

try:

    file1 = open('test.txt','rb') 
    #打開文件,不要填寫encoding信息
    
    r = file1.read()
    f_charinfo = chardet.detect(r)
    print(f_charinfo) #打印看下chardet.detect(r)是個什么樣的字典
    print(r.decode(f_charinfo['encoding'])) #根據文檔編碼,靈活打開
    file1.close()
except:
    if file1:
        file1.close()
        print('err')
'''
博客來自:
https://blog.csdn.net/Ltinginger/article/details/83105266
'''

  


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM