【pandas】數據去重

本文轉載自查看原文 2020-05-18 11:33 2340 Python

現在有一列數據，列名demo

該列中存在重復數據，現在要對數據去重

利用pandas的drop_duplicates方法，subset指列名，keep指只保留遇到的第1個結果

import pandas as pd data={'demo':[1,1,2,2,1,2,2,3,4,5,6,98,4,2,4,5,2,5,6,7]} df=pd.DataFrame(data) a=df.drop_duplicates(subset=['demo'],keep='first') print(a)

效果：

demo列中重復的數據就已經沒有了

參考文檔：

pandas 篩選去除重復的數據

免責聲明！

本站轉載的文章為個人學習借鑒使用，本站對版權不負任何法律責任。如果侵犯了您的隱私權益，請聯系本站郵箱yoyou2525@163.com刪除。

猜您在找 pandas 常用清洗數據（三）排序，去重 pandas中DataFrame和Series的數據去重 Pandas 數據篩選,去重結合group by pandas-22 數據去重處理 pandas之去重 pandas dataframe重復數據查看.判斷.去重基於pandas索引的數據查找、排序和去重小結【Python數據分析】pandas去重和替換 pandas excel合並去重利用pandas去重