字符串編碼常用類型:utf-8,gb2312,cp936,gbk等。
python中,我們使用decode()和encode()來進行解碼和編碼
在python中,使用unicode類型作為編碼的基礎類型。即
decode encode
u = u'中文' #顯示指定unicode類型對象u str = u.encode('gb2312') #以gb2312編碼對unicode對像進行編碼
u1 = str.decode('gb2312')#以gb2312編碼對字符串str進行解碼,以獲取unicode u2 = str.decode('utf-8')#如果以utf-8的編碼對str進行解碼得到的結果,將無法還原原來的unicode類型
GBK轉成UTF-8過程(Python2 中默認編碼為ASCII,需要聲明 編碼方式為UTF-8)
GBK-decode(解碼)到Unicode
Unicode-encode(編碼)到GBK
UTF-8-decode(解碼)到Unicode
Unicode-encode(編碼)到UTF-8
Pyhton3中默認編碼為 Unicode編碼
在編碼的時候會將數據轉成bytes類型
在解碼的時候會將數據轉成字符串類型