DataFrame.drop_duplicates(subset=None, keep='first', inplace=False)
subset
考慮重復發生在哪一列,默認考慮所有列,就是在任何一列上出現重復都算作是重復數據
keep
包含三個參數first
, last
, False
,first
是指,保留搜索到的第一個重復數據,之后的都刪除;last
是指,保留搜索到的最后一個重復數據,之前的搜索到的重復數據都刪除,False
是指,把所有搜索到的重復數據都刪除,一個都不保留,即如果有兩行數據重復,把兩行數據都刪除,而不是保留其中一行。默認參數是first
。