import urllib.request
response = urllib.request.urlopen("https://www.51job.com")
print(response.read().decode('utf-8'))
报错
UnicodeDecodeError: 'utf-8' codec can't decode byte 0xd5 in position 225: invalid continuation byte
改为
print(response.read().decode('gbk'))
程序就好了
翻到了一篇博客,里面有这么一段话:
如果python中所要处理的字符串中包含中文,那么最好要搞懂所用字符的编码,是gbk/gb2312/gb18030,还是utf-8,否则容易出现乱码,以及此处的语法错误。
尝试将编码方式改为“gbk”或者“gb2312”以及“gb18030”之后,输出就正常了,这说明原来的中文字符是采用gbk/gb2312/gb18030编码的。