python中英文字母和中文漢字所占的字節


print(type('李傑'.encode('utf-8')))#<class 'bytes'>
print(type('李傑'.encode('gbk')))#<class 'bytes'>
print(len('李傑'.encode('utf-8')))#6
print(len('李傑'.encode('gbk')))#4
print(len(',。'.encode('gbk')))#4

 英文和符號:

print(type('li'.encode('utf-8')))#<class 'bytes'>
print(type('li'.encode('gbk')))#<class 'bytes'>
print(len('li'.encode('utf-8')))#2
print(len('li'.encode('gbk')))#2
print(len(',.'.encode('gbk')))#2

  所以:

utf-8編碼:一個中文包含繁體字等於三個字節,一個英文字符等於一個字節。
gbk編碼:一個中文包含繁體字等於二個字節,一個英文字符等於一個字節。

 


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM