[Python]python對csv去除重復行 python 2020.2.11

本文轉載自查看原文 2020-02-11 02:09 4194 Python 3/ 生活日志

用pandas庫的.drop_duplicates函數

代碼如下：

1 import shutil
2 import pandas as pd
3 
4 
5 frame=pd.read_csv('E:/bdbk.csv',engine='python')
6 data = frame.drop_duplicates(subset=['名稱'], keep='first', inplace=False)
7 data.to_csv('E:/baike.csv', encoding='utf8')

.drop_duplicates有三個參數

DataFrame.drop_duplicates(subset=None, keep='first', inplace=False)

如subset=['A','B']去A列和B列重復的數據

參數如下：

subset : column label or sequence of labels, optional
用來指定特定的列，默認所有列
keep : {‘first’, ‘last’, False}, default ‘first’
刪除重復項並保留第一次出現的項
inplace : boolean, default False
是直接在原來數據上修改還是保留一個副本

免責聲明！

本站轉載的文章為個人學習借鑒使用，本站對版權不負任何法律責任。如果侵犯了您的隱私權益，請聯系本站郵箱yoyou2525@163.com刪除。

猜您在找 python去除數據的重復行 python去除文件中重復的行 [Python]pyhon去除txt文件重復行 python 2020.2.10 python list去除重復 Python 去重csv文件中相同的重復行 PYthon 從numpy數組去除重復元素，行或列 python去除重復元素 PYTHON去除重復元素2 python將列表按行寫入csv Python csv 跳過第一行去除表頭讀取文件內容