python unicode轉中文及轉換默認編碼

本文轉載自查看原文 2017-10-25 20:45 16497 python

漢字前面加個u就可以把漢字轉換成unicode編碼格式

In [1]: s = u"學海無涯，回頭是岸"

In [2]: s
Out[2]: u'\u5b66\u6d77\u65e0\u6daf\uff0c\u56de\u5934\u662f\u5cb8'

In [3]: print s
學海無涯，回頭是岸


1.在爬蟲抓取網頁信息時常需要將類似    '\u82e6\u6d77\u65e0\u6daf\u56de\u5934\u662f\u5cb8'   轉換為中文，實際上這是unicode的中文編碼。可用以下方法轉換(注意一個前面有u一個沒有)：
In [1]: s = '\u82e6\u6d77\u65e0\u6daf\u56de\u5934\u662f\u5cb8'

In [2]: print s.decode("unicode_escape")
苦海無涯回頭是岸

In [3]: 
                             
                   或者:


In [7]: s = u'\u82e6\u6d77\u65e0\u6daf\u56de\u5934\u662f\u5cb8'

In [8]: print s
苦海無涯回頭是岸

2.在python2的字符編碼問題時常會遇到“UnicodeEncodeError: 'ascii' codec can't encode characters in position 0-5: ordinal not in range(128)”的編碼錯誤。
可以用以下方法通常可以解決：
import sys
reload(sys)
sys.setdefaultencoding('utf-8')
此方法是將Python2的默認編碼ASCII改為 utf-8。但此方法不是一勞永逸的，可能會使一些代碼的行為變得怪異

免責聲明！

本站轉載的文章為個人學習借鑒使用，本站對版權不負任何法律責任。如果侵犯了您的隱私權益，請聯系本站郵箱yoyou2525@163.com刪除。

猜您在找 python unicode和string byte, unicode轉中文及轉換默認編碼 java中文和unicode編碼相互轉換(轉) Java unicode中文編碼轉換和反轉 Java實現中文轉換成Unicode編碼和 Unicode編碼轉換成中文 Qt中文編碼和QString類Unicode編碼轉換 python2中將Unicode編碼的中文和str相互轉換 python,列表內unicode編碼中文亂碼，字符串轉列表，兩個列表轉字典漢字編碼（【Unicode】【UTF-8】【Unicode與UTF-8之間的轉換】【漢字 Unicode 編碼范圍】【中文標點Unicode碼】【GBK編碼】【批量獲取漢字UNICODE碼】） python 正則匹配中文(unicode)(轉) Unicode與中文的轉換-java