Python3中遇到UnicodeEncodeError: 'ascii' codec can't encode characters in ordinal not in range(128)


Python3中遇到UnicodeEncodeError: 'ascii' codec can't encode characters in ordinal not in range(128)

 

現象

打印任何一種包含有中文的對象,字典、列表、DataFrame、或字符串。比如:

print('中文')

控制台報錯:

Traceback (most recent call last):
  File "printcn.py", line 1, in <module>
    print('\u4e2d\u6587')
UnicodeEncodeError: 'ascii' codec can't encode characters in position 0-1: ordinal not in range(128)

換另外一台機器可以正常顯示 中文 。或者在PyCharm里執行也可以正常顯示。只有在命令行控制台會報錯。

我的環境是MacOS 10.13.3 中文,Anaconda3 5.0.1

Python 3.6.3 |Anaconda custom (64-bit)| (default, Oct  6 2017, 12:04:38) 
[GCC 4.2.1 Compatible Clang 4.0.1 (tags/RELEASE_401/final)] on darwin
Type "help", "copyright", "credits" or "license" for more information.
>>> 

查找原因

如果是python 2.X的話需要在文件中加上 # -*- coding: utf-8 -*- 、以及 reload(sys) sys.setdefaultencoding("utf8") 。但是Python3應當默認就使用utf8編碼,而且即使設置了這些也仍然不能正常打印。

有些人說用encode('utf-8')函數解決,但如果直接打印字典或DataFrame,總不能每個元素都encode一般吧。

最終查看了一下系統環境編碼

>>> import sys
>>> sys.stdout.encoding
'US-ASCII'

而另一台能正常打印的機器是 en_US.UTF-8 

解決辦法

(1)設置環境變量LANG

在linux或Mac上設置環境變量的方式一樣,編輯~/.bash_profile文件('~'指的是用戶登錄后的默認目錄),添加一行:

export LANG="en_US.UTF-8"

保存退出后重新打開命令行控制台

(2)使用PYTHONIOENCODING

在運行python命令前添加參數 PYTHONIOENCODING=utf-8 python printcn.py 

該參數的解釋可查看官方文檔:https://docs.python.org/3.6/using/cmdline.html#envvar-PYTHONIOENCODING

(3)重新定義標准輸出

在代碼中添加 sys.stdout = codecs.getwriter("utf-8")(sys.stdout.detach()) ,使代碼變為:

import sys
import codecs
sys.stdout = codecs.getwriter("utf-8")(sys.stdout.detach())
print('中文')

 

 


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM