DataFrame 數據去重

本文轉載自查看原文 2018-03-21 13:38 20610 pandas


df.head()
>>>
Price	Seqno	Symbol	time
0	1623.0	0.0	APPL	1473411962
1	1623.0	0.0	APPL	1473411962
2	1623.0	0.0	APPL	1473411963
3	1623.0	0.0	APPL	1473411963
4	1649.0	1.0	APPL	1473411963

df.drop_duplicates(["Seqno"],keep="last").head()
>>>
	Price	Seqno	Symbol	time
3	1623.0	0.0	APPL	1473411963
7	1649.0	1.0	APPL	1473411964
11	1642.0	2.0	APPL	1473411965
15	1636.0	3.0	APPL	1473411966
19	1669.0	4.0	APPL	1473411967

df.drop_duplicates(subset=None, keep='first', inplace=False)

1 data.drop_duplicates()#data中一行元素全部相同時才去除

2 data.drop_duplicates(['a','b'])#data根據’a','b'組合列刪除重復項，默認保留第一個出現的值組合。傳入參數keep='last'則保留最后一個

免責聲明！

本站轉載的文章為個人學習借鑒使用，本站對版權不負任何法律責任。如果侵犯了您的隱私權益，請聯系本站郵箱yoyou2525@163.com刪除。

猜您在找 DataFrame(7):數據去重 pandas中DataFrame和Series的數據去重 dataframe去重 pandas dataframe重復數據查看.判斷.去重 Python中DataFrame去重 dataframe去重 drop_duplicates 第十四課：Pandas(2)行情數據處理，DataFrame合並去重以及計算漲跌幅 Pandas —— （6）多個DataFrame的合並、連接、去重、替換 DataFrame 按列篩選數據 pandas之Dataframe轉成dict+過濾+index去重