python的文件編碼處理有點粗魯
1.不管文件原來是編碼類型,讀入后都轉換成Unicode的編碼
2.寫入文件時,write函數把變量以讀入文件的編碼方式寫入(根據open(path,mode,encoding='utf-8')里的encoding,這個的utf-8只是舉個例子,如果encoding未賦值,責根據解釋器默認的文件讀入編碼模式來編碼),(舉個例子:讀入文件是gbk編碼,處理過程是用Unicode處理,處理完 了會轉成gbk保存。這些事兒都是python默默的做的)
3.如果想中途轉換編碼格式,encode就是將Unicode編碼成目標編碼格式的二進制碼,decode就是將有編碼格式的二進制碼轉換成Unicode,所以在python的中間處理過程中,在處理的只有Unicode編碼格式的數據。
4.py文件保存磁盤的編碼方式在file-settings-editor-file encoding-project encoding(pycharm)
5.pycharm控制台輸出的解碼方式是在file-settings-editor-file encoding-global encoding(pycharm)
粗魯而簡單
encoding目前可以的賦值,utf-8
utf-16
gbk
