Python中的string和bytes的转换


总的来说,bytes和string的关系是:

\(bytes\xrightarrow{decode}string\)

\(bytes\xleftarrow{encode}string\)

常见的几种编码及格式

  • utf8:形如\xe4\xbb\x8a\xe5\xa4
  • unicode:形如\u4eca\u5929\u5929\u6c14\u4e0d\u9519
  • 注意:如果\变成了\\说明,原字符串是编码后的格式,变成\\是因为转换成了bytes

下面是几种常见的功能

  1. string转bytes
s = "abc"		#string
s = "abc".encode()		#bytes,encode默认编码方式是utf-8
s = b"abc"		#bytes
  1. bytes转string
s = b"abc"		#bytes
s = b"abc".decode()		#string,encode默认编码方式是utf-8
s = str(b"")	#string
  1. bytes类型的unicode(中文)输出
s = '\\u4eca\\u5929\\u5929\\u6c14\\u4e0d\\u9519'		#中文是:今天天气真不错
new_s = s.encode().decode('unicode_escape')		#输出为:今天天气真不错


免责声明!

本站转载的文章为个人学习借鉴使用,本站对版权不负任何法律责任。如果侵犯了您的隐私权益,请联系本站邮箱yoyou2525@163.com删除。



 
粤ICP备18138465号  © 2018-2025 CODEPRJ.COM