example:
df2 = df.loc[~df[col].isin(list)]
“~”符號在這里是取反的意思,表示對 df[col].isin(list) 這句返回的值取反,主要用於數據的 slicing。比如 df 是如下的格式:
我們希望從 df 中刪去 list = ['H', 'I', 'J', 'K', 'L', 'M', 'N'] 中的列,但是注意到
['H', 'I', 'J', 'K', 'L', 'M', 'N']
df 中只有 'H', 'I', 'J' 是在 list 里面的,我們需要把 'K', 'L', 'M', 'N' 的列都去掉,從而得到以下的df2:
我們用 boolean 的操作進行 slicing。
1. 用isin(list) 判斷每個 column 是否在 list里面,如果在就返回 True,否則返回 False。
2. 用 df[col] 對每個列都進行判斷,由 df[col].isin(list) 返回針對每個列的 True/False 值,也就是 [False, False, False, False, False, False, False, True, True, True]。
3. 用 ~ 對 True/False 值列表進行取反,得到 [True, True, True, True, True, True, True, False, False, False]
4. 用 df.loc 選擇出 boolean 值為 True 的前6列,得到 df2: