【pandas】數據去重


 

現在有一列數據,列名demo

該列中存在重復數據,現在要對數據去重

利用pandas的drop_duplicates方法,subset指列名,keep指只保留遇到的第1個結果

import pandas as pd data={'demo':[1,1,2,2,1,2,2,3,4,5,6,98,4,2,4,5,2,5,6,7]} df=pd.DataFrame(data) a=df.drop_duplicates(subset=['demo'],keep='first') print(a)

效果:

demo列中重復的數據就已經沒有了

 

 

 

參考文檔:

pandas 篩選去除重復的數據


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM