dataframe去重 drop_duplicates


data.drop_duplicates() #默认:data中一行元素全部相同时才去除
data.drop_duplicates(['a','b'])#data根据’a','b'组合列删除重复项,默认保留第一个出现的值组合。
data.drop_duplicates(['a','b'],keep='last') 传入参数keep='last'则保留最后一个,传入False则全部删除。

 


免责声明!

本站转载的文章为个人学习借鉴使用,本站对版权不负任何法律责任。如果侵犯了您的隐私权益,请联系本站邮箱yoyou2525@163.com删除。



 
粤ICP备18138465号  © 2018-2025 CODEPRJ.COM