python dataframe drop_duplicates


這個drop_duplicate方法是對DataFrame格式的數據,去除特定列下面的重復行。返回DataFrame格式的數據
DataFrame.drop_duplicates(subset=None, keep='first', inplace=False)
subset : column label or sequence of labels, optional 
用來指定特定的列,默認所有列
keep : {‘first’, ‘last’, False}, default ‘first’ 
刪除重復項並保留第一次出現的項
inplace : boolean, default False 
是直接在原來數據上修改還是保留一個副本
data.drop_duplicates()#data中一行元素全部相同時才去除

 


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM