pandas中drop_duplicates用法

本文转载自查看原文 2019-10-15 22:39 866 python study

pandas.DataFrame.drop_duplicates(self, subset=None, keep='first', inplace=False)

　默认subset为全部列，但是可以自己指定

data=pd.DataFrame({'A':[2,2,3,2],'b':[2,3,2,2],'c':[2,2,1,3],'d':[1,1,3,3]})
data

data = data.drop_duplicates()
data

data.drop_duplicates(subset=['A','b'], keep='last',inplace=True)   # subset 参数表示的是对比哪几列
print(data)

本站转载的文章为个人学习借鉴使用，本站对版权不负任何法律责任。如果侵犯了您的隐私权益，请联系本站邮箱yoyou2525@163.com删除。

猜您在找 pandas drop_duplicates 关于drop_duplicates的两种用法 drop_duplicates()函数 pandas使用drop_duplicates去除DataFrame重复项 Lesson11——Pandas去重函数：drop_duplicates() 解决Pandas drop_duplicates()去重失败的可能问题之一 python dataframe drop_duplicates用法技巧去重 dataframe去重 drop_duplicates python dataframe drop_duplicates 3-Pandas数据初探索之缺失值处理与丢弃数据（填充fillna()、删除drop()、drop_duplicates()、dropna()）