原文鏈接:https://blog.csdn.net/shijing_0214/article/details/51971734
使用python的時候,經常會遇到文本編碼的問題,其中最常見的就是“'gbk' codec can't decode byte 0xad in position 12: illegal multibyte sequence”。
解決方法:將“gbk”轉化成utf8 也可以這樣用。
- 在打開文本的時候,設置編碼格式 open('1.txt',encoding='gbk')
- 如果第一步不能解決的話,可能是文本中出現了一些特殊字符,超出了gbk 的編碼范圍,可以使用編碼更加廣泛的“gb18030”,如:open("1.txt",encoding = 'gb18030')
- 要是第二還不行的話,哈哈哈,還有第三種方法,可以使用‘ignore’屬性進行忽略。open(‘1.txt’,encoding=’gb18030’,errors=‘ignore’);
- 還有一種常見解決方法為open(‘1.txt’).read().decode(‘gb18030’,’ignore’)