data = frame.drop_duplicates(subset=’’, keep='first', inplace=’’)
drop_duplicates用法:subset=‘需要去重復的列名’, keep=‘遇到重復的時保留第一個還是保留最后一個’, inplace=‘去除重復項,還是保留重復項的副本
- 添加如下代碼
re_row=df.drop_duplicates(['補助天數'])
re_row.to_excel(new_excel)
2.運行代碼,發現有的數據刪除過多,如果不同姓名的人存在相同的記錄就會刪除,所以需要判斷同一個人名的數據相同時再刪除,按照語法填寫就是所有內容進行判斷
re_row=df.drop_duplicates(subset=None,keep='first',inplace=None)
re_row.to_excel(new_excel)
效果圖