Python 編解碼


字符串編碼常用類型:utf-8,gb2312,cp936,gbk等。

python中,我們使用decode()和encode()來進行解碼和編碼

在python中,使用unicode類型作為編碼的基礎類型。即

     decode              encode

u = u'中文' #顯示指定unicode類型對象u
str = u.encode('gb2312') #以gb2312編碼對unicode對像進行編碼

u1 = str.decode('gb2312')#以gb2312編碼對字符串str進行解碼,以獲取unicode
u2 = str.decode('utf-8')#如果以utf-8的編碼對str進行解碼得到的結果,將無法還原原來的unicode類型

 GBK轉成UTF-8過程(Python2   中默認編碼為ASCII,需要聲明 編碼方式為UTF-8)  

GBK-decode(解碼)到Unicode

Unicode-encode(編碼)到GBK

UTF-8-decode(解碼)到Unicode

Unicode-encode(編碼)到UTF-8

 

 

Pyhton3中默認編碼為 Unicode編碼

在編碼的時候會將數據轉成bytes類型

在解碼的時候會將數據轉成字符串類型

 


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM