主要原因是因為編碼的問題,可能是因為0x80這個字節在gbk編碼中沒有這個字符,可能原字符是兩個字節,在gbk里被解析成了一個字節,導致字符不存在。解決方法有兩個,一個是二進制讀取,一個是改編編碼方式:
with open('article.txt','r',encoding='UTF-8') as f: # 打開新的文本
text_new = f.read() # 讀取文本數據
主要原因是因為編碼的問題,可能是因為0x80這個字節在gbk編碼中沒有這個字符,可能原字符是兩個字節,在gbk里被解析成了一個字節,導致字符不存在。解決方法有兩個,一個是二進制讀取,一個是改編編碼方式:
with open('article.txt','r',encoding='UTF-8') as f: # 打開新的文本
text_new = f.read() # 讀取文本數據
本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。