在R的使用過程中我們幾乎都繞不開Hadley Wickham 開發的幾個包,前面說過的ggplot2、reshape2以及即將要講的dplyr
因為這幾個包可以非常輕易的使我們從復雜的數據操作中逃離,操作過程簡潔,最重要的是數據結果也異常簡潔。
首先我們來了解下第一個函數filter()
filter(.data, ...)
參數很簡單,只有data,即要操作的數據對象,其他都是數據操作條件。
下面看一些簡單的例子
library(dplyr) x<-data.frame(id=1:6, name=c("wang","zhang","li","chen","zhao","song"), shuxue=c(89,85,68,79,96,53), yuwen=c(77,68,86,87,92,63))
dim(x)#查看數據行列屬性
[1] 6 4
x
filter(x,name=="zhang")
filter(x,shuxue>60,yuwen<90)
可以進行多條件篩選,條件可以用逗號隔開
filter(x,shuxue>80|yuwen<80)
多條件篩選,也可以用連接符&或| 進行連接。
相對而言,filter()還是比較簡單,使用過程主要還是要看個人的靈活程度。