如何解決 Python print 輸出文本顯示 gbk 編碼錯誤


------------恢復內容開始------------

前陣子想爬點東西,結果一直提示錯誤UnicodeEncodeError: ‘gbk’ codec can’t encode character ‘\xa0’ in position,在網上一查,發現是 Windows 的控制台的問題。控制台的編碼是 GBK,Python 是 UTF-8,造成了沖突。下面給出三種解決方法:

第一種方法:直接替換出錯的內容

 

import requests 
url = 'https://segmentfault.com/a/1190000015617318' 
 
print(requests.get(url).text.replace('\xa0', ' '))

 

第二種方法:再解碼

先用 GBK 編碼,加個 ignore 丟棄錯誤的字符,然后再解碼。

import requests
url = 'https://segmentfault.com/a/1190000015617318'
 
print(requests.get(url).text.encode('gbk', 'ignore').decode('gbk')

 

 

第三種方法:修改控制台編碼

新建一個 cmd.reg, 輸入代碼:

Windows Registry Editor Version 5.00
 
[HKEY_CURRENT_USER\Console\%SystemRoot%_system32_cmd.exe]
"CodePage"=dword:0000fde9
"FontFamily"=dword:00000036
"FontWeight"=dword:00000190
"FaceName"="Consolas"
"ScreenBufferSize"=dword:232900d2
"WindowSize"=dword:002b00d2

 

------------恢復內容結束------------


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM