R语言中plyr包 前言 apply族函数是R语言中很有特色的一类函数,包括了apply、sapply、lapply、tapply、aggregate等等。这一类函数本质上是将数据进行分割、计算和整合。它们在数据分析的各个阶段都有很好的用处。例如在数据准备阶段,我们可以按某个标准将数据分组 ...
R语言dplyr包 前言 年刚到, 就在 Feedly 订阅里看到 RStudio Blog 介绍 dplyr 包已发布 Introducing dplyr , 此包将原本 plyr 包中的 ddply 等函数进一步分离强化, 专注接受dataframe对象, 大幅提高了速度, 并且提供了更稳健的与其它数据库对象间的接口。 既然是 Hadley Wickham 的新作, 并自称 a grammar ...
2016-06-08 09:59 0 2800 推荐指数:
R语言中plyr包 前言 apply族函数是R语言中很有特色的一类函数,包括了apply、sapply、lapply、tapply、aggregate等等。这一类函数本质上是将数据进行分割、计算和整合。它们在数据分析的各个阶段都有很好的用处。例如在数据准备阶段,我们可以按某个标准将数据分组 ...
R语言中reshape2函数族 前言 前几天放出来的那个R的展示中,有说到其实学R的过程更多的就是熟悉各种函数的过程(学习统计模型不在此列...我个人还是倾向于不要借助软件来学习理论知识,虽然可以直接看codes...笔和纸上的推导还是不可或缺的基本功),然后各种基础函数熟悉了之后很多被打 ...
dplyr包可以看作是plyr包的一个扩展,主要是针对数据框的数据操作。 在使用dplyr包中的函数对数据框进行操作之间,最好将其转换为tbl对象:tbl_df() 一个很好的效果是,tbl对象可以根据显示空间大小来进行部分显示。 利用dplyr包常见的数据操作可归纳为以下5种: 1. ...
dplyr包是Hadley Wickham的新作,主要用于数据清洗和整理,该包专注dataframe数据格式,从而大幅提高了数据处理速度,并且提供了与其它数据库的接口;tidyr包的作者是Hadley Wickham, 该包用于“tidy”你的数据,这个包常跟dplyr结合使用。 本文 ...
R语言中的数据处理包dplyr、tidyr笔记 dplyr包是Hadley Wickham的新作,主要用于数据清洗和整理,该包专注dataframe数据格式,从而大幅提高了数据处理速度,并且提供了与其它数据库的接口;tidyr包的作者 ...
#tbl对象 使用dplyr包预处理时建议使用tbl_df()函数或tbl_cube()函数或tbl_sql()函数将原数据转换为tbl对象,因为dplyr包用C语言开发,对处理tbl对象是非常迅速的。语法: tbl_df(src, ...) tbl_cube(dimensions ...
R语言中aggregate函数 前言 这个函数的功能比较强大,它首先将数据进行分组(按行),然后对每一组数据进行函数统计,最后把结果组合成一个比较nice的表格返回。根据数据对象不同它有三种用法,分别应用于数据框(data.frame)、公式(formula)和时间序列(ts ...
R语言中的apply函数族 前言 最初学习R的时候,当成“又一门编程语言”来学习,但是怎么学都觉得别扭。现在我的看法倾向于,R不是一种通用型的编程语言,而是一种统计领域的软件工具。因此,不能用通用型编程的思维来设计R代码。R是一种面向数组(array-oriented)的语法,它更像数学 ...