現在有一列數據,列名demo
該列中存在重復數據,現在要對數據去重
利用pandas的drop_duplicates方法,subset指列名,keep指只保留遇到的第1個結果
import pandas as pd data={'demo':[1,1,2,2,1,2,2,3,4,5,6,98,4,2,4,5,2,5,6,7]} df=pd.DataFrame(data) a=df.drop_duplicates(subset=['demo'],keep='first') print(a)
效果:
demo列中重復的數據就已經沒有了
參考文檔: