python 去重和保留重復值方法 duplicated 和 drop_duplicates

本文轉載自查看原文 2020-07-13 14:32 2827

import pandas as pd
1.duplicated 保留重復值
 源碼默認標記重復的第一個為不重復第，duplicated(keep='first')

# duplicated 標記重復值，若想第一次出現和最后一次出現不標記那么在參數keep填充相應的參數，如果想標記全部出現的重復值，那么keep=False

animals = pd.Series(['lama', 'cow', 'lama', 'beetle', 'lama'])
animals1 = animals.duplicated(keep='first')
print(animals1)
animals2 = animals.duplicated(keep='last')
print(animals2)
animals3 = animals.duplicated(keep= False)
print(animals3)
2.

drop_duplicates 去除重復值

源碼默認保留第一個，可用inplace 直接修改數據源drop_duplicates(keep='first', inplace=False)

# drop_duplicates 去除重復值，若想保留第一次出現或者保留最后一次出現，那么在參數keep填充相應的參數
animals_d1 = animals.drop_duplicates(keep='first')
print(animals_d1)
animals_d2 = animals.drop_duplicates(keep='last')
print(animals_d2)

免責聲明！

本站轉載的文章為個人學習借鑒使用，本站對版權不負任何法律責任。如果侵犯了您的隱私權益，請聯系本站郵箱yoyou2525@163.com刪除。

猜您在找 Lesson11——Pandas去重函數：drop_duplicates() pandas使用drop_duplicates去除DataFrame重復項關於drop_duplicates的兩種用法 pandas常用操作詳解——pandas的去重操作df.duplicated()與df.drop_duplicates() Python學習筆記：pd.drop_duplicates刪除重復行 df.drop_duplicates()返回刪除重復行（或者列）的DataFrame js 去掉數組中重復值，不重復的值保留 Mysql重復數據去重保留一條數據 JS實現數組去重（重復的元素只保留一個） mysql 去重，刪除重復數據保留id最大的數據