python讀txt文件避免編碼錯誤的最佳實踐


python讀取txt文件

1、錯誤一

with open(path,'r') as f:
       for line in f:
       line = line.strip()    
#
# 報錯: UnicodeDecodeError: 'gbk' codec can't decode byte 0xac in position 451428: illegal multibyte sequence
 
        

2、錯誤二

with open(path,encoding="UTF-8")

#
# 報錯: UnicodeDecodeError: 'utf-8' codec can't decode byte 0xc0 in position 278: invalid start byte
 
        

三、最好的辦法

with open(path, 'rb') as f:#使用二進制讀取
    for line in f:    #line的數據類型是bytes
        line = str(line)    #將bytes類型轉換為str類型
        line = line.strip()

 


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM