[python基礎] python 2與python 3之間的區別 —— 默認中文字符串長

本文轉載自查看原文 2017-10-23 21:16 2649 python

在python 2.7中使用len獲得中文字符串長度時：

>>> len('中文')
4

>>> a='你好'
>>> a
'\xc4\xe3\xba\xc3'
>>> len(a.encode('utf-8'))
 Traceback (most recent call last): File "<pyshell#77>", line 1, in <module>
    len(a.encode('utf-8'))
UnicodeDecodeError: 'ascii' codec can't decode byte 0xc4 in position 0: ordinal not in range(128)

在python 3.x中使用len獲得中文字符串長度時：

>>> len('中文')
2

>>> a='你好'
>>> a
'你好'
>>> len(a.encode('utf-8'))
6

從python 3開始，字符串默認均使用unicode

免責聲明！

本站轉載的文章為個人學習借鑒使用，本站對版權不負任何法律責任。如果侵犯了您的隱私權益，請聯系本站郵箱yoyou2525@163.com刪除。

猜您在找 【292】Python 關於中文字符串的操作 python截取中文字符串判斷字符串是否以中文字符開頭 go 對中文字符串的操作 js jQuery中文字符串比較特定中文字符串正則匹配 golang 截取中文字符串 Qt 中文字符串問題 python 2.7中文字符串的匹配（參考） Python 中文字符串長度讀取不一致解決