python:汉字编码


汉字编码

国标系列:

    GB18030 (二字节或四字节编码, 共27533个字)

    GBK (二字节编码, 共21003个字)

    GB2312 (二字节编码,共6763个汉字) (Windows常用)

国际标准:

     UNICODE <---> UTF-8 (Linux / Mac OS X / IOS / Android 等常用)

python编码字符串:

       'gb2312'   

       'gbk'       

      'gb18030'         

      'utf-8'         

      'ascii' ...

      以上字符串用于encode和 decode中

编码注释:

    在python源文件的第一行或第二行写入如下内容:

      # -*- coding:gbk -*-                  # 设置源文件编码格式为gbk

      或 # -*- coding:utf-8 -*-         # 设置源文件编码格式为utf-8

       作用: 告诉解释执行器,此前文件的编码是什么


免责声明!

本站转载的文章为个人学习借鉴使用,本站对版权不负任何法律责任。如果侵犯了您的隐私权益,请联系本站邮箱yoyou2525@163.com删除。



 
粤ICP备18138465号  © 2018-2025 CODEPRJ.COM