dataframe删除重复行


一般写法:

    dataframe名称.drop_duplicates(subset=['A','B'],keep='last',inplace=True,ignore_index False)

解释:

    subset=['A','B']:要A和B列同时重复才删除;

    keep='last':有重复时保留后面的行;

    inplace=True:用删除后的dataframe替换掉原来的;

    默认情况下ignore_index False,这种情况下会保留原来的index序号(0,1,3,4这样)。若ignore_index =True,则重新将index序号排序(0,1,2,3这样)


免责声明!

本站转载的文章为个人学习借鉴使用,本站对版权不负任何法律责任。如果侵犯了您的隐私权益,请联系本站邮箱yoyou2525@163.com删除。



 
粤ICP备18138465号  © 2018-2025 CODEPRJ.COM