【pandas】数据去重

本文转载自查看原文 2020-05-18 11:33 2340 Python

现在有一列数据，列名demo

该列中存在重复数据，现在要对数据去重

利用pandas的drop_duplicates方法，subset指列名，keep指只保留遇到的第1个结果

import pandas as pd data={'demo':[1,1,2,2,1,2,2,3,4,5,6,98,4,2,4,5,2,5,6,7]} df=pd.DataFrame(data) a=df.drop_duplicates(subset=['demo'],keep='first') print(a)

效果：

demo列中重复的数据就已经没有了

参考文档：

pandas 筛选去除重复的数据

免责声明！

本站转载的文章为个人学习借鉴使用，本站对版权不负任何法律责任。如果侵犯了您的隐私权益，请联系本站邮箱yoyou2525@163.com删除。

猜您在找 pandas 常用清洗数据（三）排序，去重 pandas中DataFrame和Series的数据去重 Pandas 数据筛选,去重结合group by pandas之去重 pandas dataframe重复数据查看.判断.去重第十四课：Pandas(2)行情数据处理，DataFrame合并去重以及计算涨跌幅 pandas 分组后去重计数 MapReduce实例(数据去重) 爬虫数据去重 Oracle 表数据去重