有這么個需求:我有許多列,我打算找到某一列等於某個值,同時另外一列中等於某個值,這樣的多個條件篩選的行,並替換篩選出來的這些這些值,顯然使用dplyr包是最好的選擇,因為速度快的飛起,即使我的數據有幾百萬行
代碼如下:
df.v %>% filter(to.x == 999, to.y==999) %>%
select(cnt,min ,max ,v_0.1,v_0.5,v_1) %>%
replace(values = -2)
這樣就把符合條件(to.x == 999, to.y==999)的所有行都挑出來了,但是只select了目標列(cnt,min ,max ,v_0.1,v_0.5,v_1),這6列符合條件的值統一用replace函數替換為了-2值
df.v %>% filter(cnt == -1) %>%
select(cnt,min ,max ,v_0.1,v_0.5,v_1) * 0.9
上面的代碼時篩選出符合條件的所有行,然后找到打算替換的部分列,直接數學運算,乘以固定數0.9,這樣就對這些選擇了的值直接計算完畢了。