pandas.DataFrame排除特定行


使用Python進行數據分析時,經常要使用到的一個數據結構就是pandas的DataFrame

如果我們想要像Excel的篩選那樣,只要其中的一行或某幾行,可以使用isin()方法,將需要的行的值以列表方式傳入,還可以傳入字典,指定列進行篩選。

但是如果我們只想要所有內容中不包含特定行的內容,卻並沒有一個isnotin()方法。我今天的工作就遇到了這樣的需求,經常查找之后,發現只能換種方式使用isin()來實現這個需求。

示例如下:

In [3]: df = pd.DataFrame([['GD', 'GX', 'FJ'], ['SD', 'SX', 'BJ'], ['HN', 'HB'
   ...: , 'AH'], ['HEN', 'HEN', 'HLJ'], ['SH', 'TJ', 'CQ']], columns=['p1', 'p2
   ...: ', 'p3'])

In [4]: df
Out[4]:
    p1   p2   p3
0   GD   GX   FJ
1   SD   SX   BJ
2   HN   HB   AH
3  HEN  HEN  HLJ
4   SH   TJ   CQ

如果只想要p1為GD和HN的兩行,可以這么做:

In [8]: df[df.p1.isin(['GD', 'HN'])]
Out[8]:
   p1  p2  p3
0  GD  GX  FJ
2  HN  HB  AH

但是如果我們想要除了這兩行之外的數據,就需要繞點路了。
原理是先把p1取出並轉換為列表,然后再從列表中去不需要的行(值)去除,然后再在DataFrame中使用isin()

In [9]: ex_list = list(df.p1)

In [10]: ex_list.remove('GD')

In [11]: ex_list.remove('HN')

In [12]: ex_list
Out[12]: ['SD', 'HEN', 'SH']

In [13]: df[df.p1.isin(ex_list)]
Out[13]:
    p1   p2   p3
1   SD   SX   BJ
3  HEN  HEN  HLJ
4   SH   TJ   CQ


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM