如何解决 Python print 输出文本显示 gbk 编码错误


------------恢复内容开始------------

前阵子想爬点东西,结果一直提示错误UnicodeEncodeError: ‘gbk’ codec can’t encode character ‘\xa0’ in position,在网上一查,发现是 Windows 的控制台的问题。控制台的编码是 GBK,Python 是 UTF-8,造成了冲突。下面给出三种解决方法:

第一种方法:直接替换出错的内容

 

import requests 
url = 'https://segmentfault.com/a/1190000015617318' 
 
print(requests.get(url).text.replace('\xa0', ' '))

 

第二种方法:再解码

先用 GBK 编码,加个 ignore 丢弃错误的字符,然后再解码。

import requests
url = 'https://segmentfault.com/a/1190000015617318'
 
print(requests.get(url).text.encode('gbk', 'ignore').decode('gbk')

 

 

第三种方法:修改控制台编码

新建一个 cmd.reg, 输入代码:

Windows Registry Editor Version 5.00
 
[HKEY_CURRENT_USER\Console\%SystemRoot%_system32_cmd.exe]
"CodePage"=dword:0000fde9
"FontFamily"=dword:00000036
"FontWeight"=dword:00000190
"FaceName"="Consolas"
"ScreenBufferSize"=dword:232900d2
"WindowSize"=dword:002b00d2

 

------------恢复内容结束------------


免责声明!

本站转载的文章为个人学习借鉴使用,本站对版权不负任何法律责任。如果侵犯了您的隐私权益,请联系本站邮箱yoyou2525@163.com删除。



 
粤ICP备18138465号  © 2018-2025 CODEPRJ.COM