Python 3的源碼.py文件的默認編碼方式為UTF-8(Python 2.x的默認編碼格式為unicode)。
encode的作用,使我們看到的直觀的字符轉換成計算機內的字節形式。
decode剛好相反,把字節形式的字符轉換成我們看的懂的、直觀的、“人模人樣”的形式。
下面給個例子:
import sys
print(sys.getdefaultencoding())
u = '奔跑吧,哈哈哈'
u1 = u.encode('GBK') # 將u編碼成GBK編碼格式的字節形式
print(u1)
u2 = u.encode('UTF-8') # 將u編碼成UTF-8編碼格式的字節形式
print(u2)
u3 = b'\xe5\xa5\x94\xe8\xb7\x91\xe5\x90\xa7\xef\xbc\x8c\xe5\x93\x88\xe5\x93\x88\xe5\x93\x88'.decode('UTF-8') # 將字節形式解碼成-8的編碼格式
print(u3)
輸出結果:
參考:
關於Python 2.x與Python3.x的編碼問題(http://blog.csdn.net/mickeymouse1928/article/details/70168794)