print(type('李傑'.encode('utf-8')))#<class 'bytes'> print(type('李傑'.encode('gbk')))#<class 'bytes'> print(len('李傑'.encode('utf-8')))#6 print(len('李傑'.encode('gbk')))#4 print(len(',。'.encode('gbk')))#4
英文和符號:
print(type('li'.encode('utf-8')))#<class 'bytes'> print(type('li'.encode('gbk')))#<class 'bytes'> print(len('li'.encode('utf-8')))#2 print(len('li'.encode('gbk')))#2 print(len(',.'.encode('gbk')))#2
所以:
utf-8編碼:一個中文包含繁體字等於三個字節,一個英文字符等於一個字節。
gbk編碼:一個中文包含繁體字等於二個字節,一個英文字符等於一個字節。