python:漢字編碼


漢字編碼

國標系列:

    GB18030 (二字節或四字節編碼, 共27533個字)

    GBK (二字節編碼, 共21003個字)

    GB2312 (二字節編碼,共6763個漢字) (Windows常用)

國際標准:

     UNICODE <---> UTF-8 (Linux / Mac OS X / IOS / Android 等常用)

python編碼字符串:

       'gb2312'   

       'gbk'       

      'gb18030'         

      'utf-8'         

      'ascii' ...

      以上字符串用於encode和 decode中

編碼注釋:

    在python源文件的第一行或第二行寫入如下內容:

      # -*- coding:gbk -*-                  # 設置源文件編碼格式為gbk

      或 # -*- coding:utf-8 -*-         # 設置源文件編碼格式為utf-8

       作用: 告訴解釋執行器,此前文件的編碼是什么


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM