Python中的解決中文字符編碼的問題


python3中str默認為Unicode的編碼格式

python2中str默認為bytes類型的編碼格式

Unicode是一32位編碼格式,不適合用來傳輸和存儲,所以必須轉換成utf-8,gbk等等

所以在Python3中必須將str類型轉換成bytes類型的

在Python中使用encode的方式可以進行字符的編碼

實際用法:

>>>a = "中國"

>>> a.encode("utf-8")

b'\xe4\xb8\xad\xe5\x9b\xbd'

>>> a.encode("gbk")

b'\xd6\xd0\xb9\xfa'

         

總結:

  1. Python中str類型轉bytes類型,相當與Unicode轉gbk,utf-8。。。類型
  2. b'代表字符編碼格式為bytes,
  3. utf-8默認24位占3個8位16進制數
  4. gbk中國編碼默認占16位2個8位16進制數字


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM