漢字編碼
國標系列:
GB18030 (二字節或四字節編碼, 共27533個字)
GBK (二字節編碼, 共21003個字)
GB2312 (二字節編碼,共6763個漢字) (Windows常用)
國際標准:
UNICODE <---> UTF-8 (Linux / Mac OS X / IOS / Android 等常用)
python編碼字符串:
'gb2312'
'gbk'
'gb18030'
'utf-8'
'ascii' ...
以上字符串用於encode和 decode中
編碼注釋:
在python源文件的第一行或第二行寫入如下內容:
# -*- coding:gbk -*- # 設置源文件編碼格式為gbk
或 # -*- coding:utf-8 -*- # 設置源文件編碼格式為utf-8
作用: 告訴解釋執行器,此前文件的編碼是什么