python 的文件編碼處理


python的文件編碼處理有點粗魯

1.不管文件原來是編碼類型,讀入后都轉換成Unicode的編碼

2.寫入文件時,write函數把變量以讀入文件的編碼方式寫入(根據open(path,mode,encoding='utf-8')里的encoding,這個的utf-8只是舉個例子,如果encoding未賦值,責根據解釋器默認的文件讀入編碼模式來編碼),(舉個例子:讀入文件是gbk編碼,處理過程是用Unicode處理,處理完 了會轉成gbk保存。這些事兒都是python默默的做的)

3.如果想中途轉換編碼格式,encode就是將Unicode編碼成目標編碼格式的二進制碼,decode就是將有編碼格式的二進制碼轉換成Unicode,所以在python的中間處理過程中,在處理的只有Unicode編碼格式的數據。

4.py文件保存磁盤的編碼方式在file-settings-editor-file encoding-project encoding(pycharm)

5.pycharm控制台輸出的解碼方式是在file-settings-editor-file encoding-global encoding(pycharm)

 

粗魯而簡單

 

encoding目前可以的賦值,utf-8

                                           utf-16

                                          gbk


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM