Python 3.x的編碼問題


Python 3的源碼.py文件的默認編碼方式為UTF-8(Python 2.x的默認編碼格式為unicode)。
encode的作用,使我們看到的直觀的字符轉換成計算機內的字節形式。
decode剛好相反,把字節形式的字符轉換成我們看的懂的、直觀的、“人模人樣”的形式。

下面給個例子:

import sys
print(sys.getdefaultencoding())

u = '奔跑吧,哈哈哈'
u1 = u.encode('GBK') # 將u編碼成GBK編碼格式的字節形式
print(u1)
u2 = u.encode('UTF-8') # 將u編碼成UTF-8編碼格式的字節形式
print(u2)

u3 = b'\xe5\xa5\x94\xe8\xb7\x91\xe5\x90\xa7\xef\xbc\x8c\xe5\x93\x88\xe5\x93\x88\xe5\x93\x88'.decode('UTF-8') # 將字節形式解碼成-8的編碼格式
print(u3)

輸出結果:

參考:
關於Python 2.x與Python3.x的編碼問題(http://blog.csdn.net/mickeymouse1928/article/details/70168794)


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM