解决python在读取文件时的编码问题

本文转载自查看原文 2020-02-21 11:28 3254 Python

一、问题

在我们进行编程的时候我们进行中文文件读取的时候往往会遇到很多编码的问题，容易出现下面的这个错误。

UnicodeDecodeError: 'utf-8' codec can't decode byte 0xc9 in position 0: invalid continuation byte

二、解决办法

通过查看文件的编码，比如用nodepad++这个文件编译器查看文件的编码格式，通过查看下面的文件可以看到，编码格式并不是我们熟悉的utf-8的编码。因此在我们进行编码的时候只需要指定编码的方式即可

代码

def read_data(): file_path = file_dir + 'base.csv'
    # 通过nodepad++查看到这个文件的编码格式是GB2312
    x = pd.read_csv(file_path, encoding="GB2312") print(x) read_data()

结果

三、参考

这篇博主的博文给了我提示，经过自己的尝试解决了这个问题，这也是解决编码问题的通用方法。

https://blog.csdn.net/wang7807564/article/details/78164855

免责声明！

本站转载的文章为个人学习借鉴使用，本站对版权不负任何法律责任。如果侵犯了您的隐私权益，请联系本站邮箱yoyou2525@163.com删除。

猜您在找 在读取文件中出现\ufeff，解决 \ufeff的问题 sublime python3中读取和写入文件时如何解决编码问题 python win32com在读取word文档时，遇到的问题解决Python使用open函数读取文件报编码问题 [转]用JAVA在读取EXCEL文件时如何判断列隐藏 python在读取文件时出现 'gbk' codec can't decode byte 0x89 in position 68: illegal multibyte sequence node.js在读取文件时中文乱码问题本地文件读取(csv,txt)时字符编码问题解决 python读取文件编码转换问题 Python读写txt文件时的编码问题