ascii、unicode、utf-8、gbk編碼區別及轉換

本文轉載自查看原文 2018-12-02 22:46 648 python

ascii

A：00000010 8位一個字節

A：00000000 00000001 00000010 00000100 32位四個字節

中：00000000 00000001 00000010 00000100 32位四個字節

A：00000110 8位一個字節

中：00000010 00000110 16位兩個字節

A：00000110 8位一個字節

中：00000010 00000110 16位兩個字節

1，各個編碼之間的二進制，是不能互相識別的，會產生亂碼。

2，文件的存儲，傳輸，不能是unicode （只能是utf-8 utf-16 gbk gbk2312 ascii等）

　　str 在內存中是Unicode編碼。

　　　　bytes類型

　　　　對於英文：

　　　　　　str：表現形式：s = 'alex'

　　　　　　　　編碼方式：010101010 unicode

　　　　　bytes：表現形式：s = b'alex'

　　　　　　　　編碼方式：000101010 utf-8 gbk。。。。

　　　　對於中文：

　　　　　　 str：表現形式：s = '中國'

　　　　　　　　編碼方式：010101010 unicode

　　　　　bytes：表現形式：s = b' x\e91\e91\e01\e21\e31\e32'

　　　　　　　　編碼方式：000101010 utf-8 gbk。。。。

　encode 編碼，如何將 str ——> bytes

　　　　使用方法： str.encode('utf-8')

　decode 解碼，如何將 bytes——> str

使用方法： bytes.decode('utf-8')

本站轉載的文章為個人學習借鑒使用，本站對版權不負任何法律責任。如果侵犯了您的隱私權益，請聯系本站郵箱yoyou2525@163.com刪除。

猜您在找 ASCII，Unicode，UTF-8，GBK 區別 ASCII編碼、GBK編碼，Unicode編碼和UTF-8。編碼轉換的方法(UNICODE/ASCII/UTF-8) [編碼]ASCII、GBK、Unicode(萬國碼) 和 UTF-8 ASCII，Unicode，GBK和UTF-8字符編碼的區別和聯系字符編碼ANSI和ASCII區別、Unicode和UTF-8區別 C#_漢字與GBK,Unicode,UTF-8編碼之間的轉換碼表 ASCII Unicode GBK UTF-8 碼表的理解(ASCII,GBK,Unicode,UTF-8等)。字符編碼中ASCII、Unicode和UTF-8的區別