python中英文字母和中文汉字所占的字节


print(type('李杰'.encode('utf-8')))#<class 'bytes'>
print(type('李杰'.encode('gbk')))#<class 'bytes'>
print(len('李杰'.encode('utf-8')))#6
print(len('李杰'.encode('gbk')))#4
print(len(',。'.encode('gbk')))#4

 英文和符号:

print(type('li'.encode('utf-8')))#<class 'bytes'>
print(type('li'.encode('gbk')))#<class 'bytes'>
print(len('li'.encode('utf-8')))#2
print(len('li'.encode('gbk')))#2
print(len(',.'.encode('gbk')))#2

  所以:

utf-8编码:一个中文包含繁体字等于三个字节,一个英文字符等于一个字节。
gbk编码:一个中文包含繁体字等于二个字节,一个英文字符等于一个字节。

 


免责声明!

本站转载的文章为个人学习借鉴使用,本站对版权不负任何法律责任。如果侵犯了您的隐私权益,请联系本站邮箱yoyou2525@163.com删除。



 
粤ICP备18138465号  © 2018-2025 CODEPRJ.COM