python 的文件编码处理


python的文件编码处理有点粗鲁

1.不管文件原来是编码类型,读入后都转换成Unicode的编码

2.写入文件时,write函数把变量以读入文件的编码方式写入(根据open(path,mode,encoding='utf-8')里的encoding,这个的utf-8只是举个例子,如果encoding未赋值,责根据解释器默认的文件读入编码模式来编码),(举个例子:读入文件是gbk编码,处理过程是用Unicode处理,处理完 了会转成gbk保存。这些事儿都是python默默的做的)

3.如果想中途转换编码格式,encode就是将Unicode编码成目标编码格式的二进制码,decode就是将有编码格式的二进制码转换成Unicode,所以在python的中间处理过程中,在处理的只有Unicode编码格式的数据。

4.py文件保存磁盘的编码方式在file-settings-editor-file encoding-project encoding(pycharm)

5.pycharm控制台输出的解码方式是在file-settings-editor-file encoding-global encoding(pycharm)

 

粗鲁而简单

 

encoding目前可以的赋值,utf-8

                                           utf-16

                                          gbk


免责声明!

本站转载的文章为个人学习借鉴使用,本站对版权不负任何法律责任。如果侵犯了您的隐私权益,请联系本站邮箱yoyou2525@163.com删除。



 
粤ICP备18138465号  © 2018-2025 CODEPRJ.COM