python中字符串编码方式小结

本文转载自查看原文 2019-01-03 21:07 912 gbk/ python/ utf-8/ 字符编码/ unicode

Python2中字符串的类型有两种：str和unicode，其中unicode是统一编码方式，它使得字符跟二进制是一一对应的，因此所有其他编码的encode都从unicode开始，而其他编码方式按照相应的编码decode之后也会变成unicode。而utf-8，gbk编码的字符都是str。

从一个界面直接输入的字符串，其默认编码为系统的默认编码方式:(又或者是当前所使用的软件客户端的编码方式：比如XShell的编码方式)

>>> import sys
>>> print sys.getdefaultencoding()
ascii

如在windows下是ascii。

那么将其转化为unicode：

>>> s =’匆匆’
>>> s
'\xb4\xd2\xb4\xd2'
>>>
>>> s1=s.decode("gbk")
>>>
>>> s1
u'\u5306\u5306'

之后将其编码为utf8:

>>> S2=s1.encode("utf8")
>>>
>>> S2
'\xe5\x8c\x86\xe5\x8c\x86'

当python头文件中包含了语句：

#-*- coding:utf-8 -*-

代码中输入的文字默认为utf8编码。

本站转载的文章为个人学习借鉴使用，本站对版权不负任何法律责任。如果侵犯了您的隐私权益，请联系本站邮箱yoyou2525@163.com删除。

猜您在找 Python中的字符串和编码 python中字符串编码转换 python3 之字符串编码小结（Unicode、utf-8、gbk、gb2312等） python中字符串的编码和解码 Python3中转换字符串编码 JAVA中的字符串小结 python中字符串的几种表达方式（用什么方式表示字符串） Python基础(字符串和编码) JS、Python对字符串的编码函数 JS中字符串的编码解码