在PyQt5中使用Pandas时的几个坑


最近在看Python GUI编程,在用到PyQt5+Pandas时遇到一些问题。这里把问题和解决方法整理一下。备查。
(好像不能上传附件,内容只好写在下面了。)

在PyQt5中使用Pandas时的几个坑

在PyQt5中使用Pandas时需要的模块库为:qtpandas,版本为1.0.4以上,才支持PyQt5。安装过程不说了,找各种方法安装吧。
安装完成后,为检测是否安装成功,运行qtpands提供的例子:BasicExample.py,过程中暴露出很多问题。

1. 无法从pandas.tslib中加载NaTType

报错模块:EditDialogs.py
模块位置:<安装目录>\Anaconda3\lib\site-packages\qtpandas-1.0.4-py3.7.egg\qtpandas\views
报错语句:from pandas.tslib import NaTType
修复方法:
从网上找到了一种方法,有效。修改报错语句为:from pandas._libs.lib import *

2. 'DataFrame' object has no attribute 'ix'

在解决上面的错误后,运行例子,并显示初始界面,但在加载数据的过程中报错。
错误信息:'DataFrame' object has no attribute 'ix'
报错模块:DataFrameModel.py
模块位置:<安装位置>\Anaconda3\lib\site-packages\qtpandas-1.0.4-py3.7.egg\qtpandas\models
报错语句:凡在对DataFrame的操作中使用了“.ix[row_index, column_index]”或类似操作的,多处。
修复方法:
猜测该错误的原因可以是qtpandas的Pandas新、旧版本之间不兼容,我使用的Pandas版本为1.0.1,已经不支持“ix”了。跟踪发现,此时row_index为整型数据,column_index为字符串数据,所以将所有使用“.ix”的地方修改为“.loc”,问题解决。

3. <class 'ValueError'>

上面问题解决后,继续运行例子,在向DataFrame添加新的列时,列名称填写“d”(应该可以任意),列的数据类型选择“datetime”类型,注意:没有填写默认值,然后在点击“OK”时,报错。
错误信息:Location based indexing can only have [integer, integer slice (START point is INCLUDED, END point is EXCLUDED), listlike of integers, boolean array] types (大意是:基于位置的索引只能有[integer,integer 切片(包括起点,不包括终点),listlike of integers,boolean array]类型)
报错模块:DataFrameModel.py
模块位置:<安装位置>\Anaconda3\lib\site-packages\qtpandas-1.0.4-py3.7.egg\qtpandas\models
报错语句:int(self._dataFrame.iloc[row, col])
修复方法:将出错的语句改为:int(self._dataFrame.loc[row, col]),即使用“loc”替换“iloc”

4. name 'NaTType' is not defined

第1个问题是import语句加载模块库时报错,这个错误则是在运行时报错。
错误信息:name 'NaTType' is not defined
报错模块:EditDialogs.py
模块位置:<安装位置>\Anaconda3\lib\site-packages\qtpandas-1.0.4-py3.7.egg\qtpandas\views
报错语句:if isinstance(defaultValue, NaTType):
修复方法:
问题的原因还是qtpandas的版本1.0.4与pandas的版本(1.0.1)不匹配造成的,具体原因是qtpandas使用的是0.2.0的pandas,而官方文档说明在pandas 0.2.0以后的版本,对于“NaTType”不再支持,应改为type(pandas.NaT)。按这个说法,将上面报错的语句修改为if isinstance(defaultValue, type(pandas.NaT)):,同时在该模块的顶部添加:import pandas。

5. 'DataFrame' object has no attribute 'set_value'

在解决上面的问题后,再运行例子,添加datetime类型的列正常(其他数据类型未测试),添加的列正确显示在界面的“表格”中,同时新添加的列的各行数据被赋予“2000-01-01”的默认值。
此时,双击新添加的列对应的值,“表格”中出现一个SpinBox,方便对日期进行调整。调整后,或不做任何调整,鼠标在其他地方单击,则报这个错误。
错误信息:'DataFrame' object has no attribute 'set_value'
报错模块:DataFrameModel.py
模块位置:\Anaconda3\lib\site-packages\qtpandas-1.0.4-py3.7.egg\qtpandas\models
报错语句:self._dataFrame.set_value(row, col, value)
修复方法:
原因是DataFram类中没有“set_value()”方法。
根据Stack Overflow网站介绍的方法,将出错的语句修改为:self._dataFrame.at[row, col] = value
运行不报错,且结果也正确。

总结

总的感觉是这个版本的qtpandas_1.0.4存在许多问题,而且几乎所有问题都是qtpandas与pandas版本不匹配造成的。不想一一检查qtpandas各个模块的所有语句,只有按上面的思路、方法,发现一个问题,解决一个问题吧。


免责声明!

本站转载的文章为个人学习借鉴使用,本站对版权不负任何法律责任。如果侵犯了您的隐私权益,请联系本站邮箱yoyou2525@163.com删除。



 
粤ICP备18138465号  © 2018-2025 CODEPRJ.COM