python在安裝時,默認的編碼是ascii,當程序中出現非ascii編碼時,python的處理常常會報這樣的錯UnicodeDecodeError: 'ascii' codec can't decode byte 0x?? in position 1: ordinal not in range(128),python沒辦法處理非ascii編碼的,此時需要自己設置將python的默認編碼,一般設置為utf8的編碼格式。
查詢系統默認編碼可以在解釋器中輸入以下命令:
python代碼
>>>sys.getdefaultencoding()
設置默認編碼時使用:
python代碼
>>>sys.setdefaultencoding('utf8')
可能會報AttributeError: 'module' object has no attribute 'setdefaultencoding'的錯誤。執行reload(sys),再執行以上命令就可以順利通過。
此時再執行sys.getdefaultencoding()就會發現編碼已經被設置為utf8的了,但是在解釋器里修改的編碼只能保證當次有效,在重啟解釋器后,會發現,編碼又被重置為默認的ascii了。
有2種方法設置python的默認編碼:
一個解決的方案在程序中加入以下代碼:
Python代碼
# encoding=utf8
import sys
reload(sys)
sys.setdefaultencoding('utf8')
另一個方案是在python的Lib\site-packages文件夾下新建一個sitecustomize.py,內容為:
Python代碼
# encoding=utf8
import sys
reload(sys)
sys.setdefaultencoding('utf8')
此時重啟python解釋器,執行sys.getdefaultencoding(),發現編碼已經被設置為utf8的了,多次重啟之后,效果相同,這是因為系統在python啟動的時候,自行調用該文件,設置系統的默認編碼,而不需要每次都手動的加上解決代碼,屬於一勞永逸的解決方法。