今天我在爬取一個網頁時出現了下面這個錯誤:
UnicodeEncodeError: 'gbk' codec can't encode character u'\xa9' in position 24051: illegal multibyte sequence
從這個錯誤來看應該是編碼時出錯了,於是我在網上查了些資料,找到了解決方法:
source_code.encode('GB18030')
解釋:GB18030是GBK的父集,所以能兼容GBK不能編碼的字符。
今天我在爬取一個網頁時出現了下面這個錯誤:
UnicodeEncodeError: 'gbk' codec can't encode character u'\xa9' in position 24051: illegal multibyte sequence
從這個錯誤來看應該是編碼時出錯了,於是我在網上查了些資料,找到了解決方法:
source_code.encode('GB18030')
解釋:GB18030是GBK的父集,所以能兼容GBK不能編碼的字符。
本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。