R語言中plyr包 前言 apply族函數是R語言中很有特色的一類函數,包括了apply、sapply、lapply、tapply、aggregate等等。這一類函數本質上是將數據進行分割、計算和整合。它們在數據分析的各個階段都有很好的用處。例如在數據准備階段,我們可以按某個標准將數據分組 ...
R語言dplyr包 前言 年剛到, 就在 Feedly 訂閱里看到 RStudio Blog 介紹 dplyr 包已發布 Introducing dplyr , 此包將原本 plyr 包中的 ddply 等函數進一步分離強化, 專注接受dataframe對象, 大幅提高了速度, 並且提供了更穩健的與其它數據庫對象間的接口。 既然是 Hadley Wickham 的新作, 並自稱 a grammar ...
2016-06-08 09:59 0 2800 推薦指數:
R語言中plyr包 前言 apply族函數是R語言中很有特色的一類函數,包括了apply、sapply、lapply、tapply、aggregate等等。這一類函數本質上是將數據進行分割、計算和整合。它們在數據分析的各個階段都有很好的用處。例如在數據准備階段,我們可以按某個標准將數據分組 ...
R語言中reshape2函數族 前言 前幾天放出來的那個R的展示中,有說到其實學R的過程更多的就是熟悉各種函數的過程(學習統計模型不在此列...我個人還是傾向於不要借助軟件來學習理論知識,雖然可以直接看codes...筆和紙上的推導還是不可或缺的基本功),然后各種基礎函數熟悉了之后很多被打 ...
dplyr包可以看作是plyr包的一個擴展,主要是針對數據框的數據操作。 在使用dplyr包中的函數對數據框進行操作之間,最好將其轉換為tbl對象:tbl_df() 一個很好的效果是,tbl對象可以根據顯示空間大小來進行部分顯示。 利用dplyr包常見的數據操作可歸納為以下5種: 1. ...
dplyr包是Hadley Wickham的新作,主要用於數據清洗和整理,該包專注dataframe數據格式,從而大幅提高了數據處理速度,並且提供了與其它數據庫的接口;tidyr包的作者是Hadley Wickham, 該包用於“tidy”你的數據,這個包常跟dplyr結合使用。 本文 ...
R語言中的數據處理包dplyr、tidyr筆記 dplyr包是Hadley Wickham的新作,主要用於數據清洗和整理,該包專注dataframe數據格式,從而大幅提高了數據處理速度,並且提供了與其它數據庫的接口;tidyr包的作者 ...
#tbl對象 使用dplyr包預處理時建議使用tbl_df()函數或tbl_cube()函數或tbl_sql()函數將原數據轉換為tbl對象,因為dplyr包用C語言開發,對處理tbl對象是非常迅速的。語法: tbl_df(src, ...) tbl_cube(dimensions ...
R語言中aggregate函數 前言 這個函數的功能比較強大,它首先將數據進行分組(按行),然后對每一組數據進行函數統計,最后把結果組合成一個比較nice的表格返回。根據數據對象不同它有三種用法,分別應用於數據框(data.frame)、公式(formula)和時間序列(ts ...
R語言中的apply函數族 前言 最初學習R的時候,當成“又一門編程語言”來學習,但是怎么學都覺得別扭。現在我的看法傾向於,R不是一種通用型的編程語言,而是一種統計領域的軟件工具。因此,不能用通用型編程的思維來設計R代碼。R是一種面向數組(array-oriented)的語法,它更像數學 ...