pandas中drop_duplicates用法


pandas.DataFrame.drop_duplicates(self, subset=None, keep='first', inplace=False)

 默認subset為全部列,但是可以自己指定

data=pd.DataFrame({'A':[2,2,3,2],'b':[2,3,2,2],'c':[2,2,1,3],'d':[1,1,3,3]})
data

  

data = data.drop_duplicates()
data

data.drop_duplicates(subset=['A','b'], keep='last',inplace=True)   # subset 參數表示的是對比哪幾列
print(data)                                           

 

 

  

  

 


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM