原文:R语言数据处理利器——dplyr简介

dplyr是由Hadley Wickham主持开发和维护的一个主要针对数据框快速计算 整合的函数包,同时提供一些常用函数的高速写法以及几个开源数据库的连接。此包是plyr包的深化功能包,其名字中的字母 d 即来源于data frame,以示其专注于数据框数据的整理和操作。我们将在本章中着重介绍一些数据处理方面的常用功能函数。 . 管道函数 在前面的简介中,我们计算了cran上的可用的函数包的数量: ...

2015-10-09 09:50 0 7751 推荐指数:

查看详情

R语言中的数据处理dplyr、tidyr笔记

        R语言中的数据处理dplyr、tidyr笔记 dplyr包是Hadley Wickham的新作,主要用于数据清洗和整理,该包专注dataframe数据格式,从而大幅提高了数据处理速度,并且提供了与其它数据库的接口;tidyr包的作者 ...

Mon Apr 10 04:07:00 CST 2017 0 8730
R语言数据处理dplyr、tidyr笔记

dplyr包是Hadley Wickham的新作,主要用于数据清洗和整理,该包专注dataframe数据格式,从而大幅提高了数据处理速度,并且提供了与其它数据库的接口;tidyr包的作者是Hadley Wickham, 该包用于“tidy”你的数据,这个包常跟dplyr结合使用。 本文 ...

Tue Nov 29 04:12:00 CST 2016 2 16853
R语言-噪声数据处理

R语言:噪声数据处理 正文   噪声是一个测量变量中的随机错误或偏差,包括错误值或偏离期望的孤立点值。在R中可以通过调用outliers软件包中的outlier函数寻找噪声数据,该函数通过寻找数据集中与其他观测值及均值差距最大的点作为异常值,函数的主要形式为:   其中,x表示一个数据 ...

Sat May 21 19:27:00 CST 2016 0 2649
R语言-异常数据处理1

R语言:异常数据处理 前言   在数据处理中,尤其在作函数拟合时,异常点的出现不仅会很大程度的改变函数拟合的效果,而且有时还会使得函数的梯度出现奇异梯度,这就导致算法的终止,从而影响研究变量之间的函数关系。为了有效的避免这些异常点造成的损失,我们需要采取一定的方法对其进行处理,而处理的第一步 ...

Mon May 23 22:53:00 CST 2016 0 6912
R语言-异常数据处理3

R语言:异常数据处理 前言   异常值也是非常痛恨的一类脏数据,异常值往往会拉高或拉低数据的整体情况,为克服异常值的影响,我们需要对异常值进行处理。首先,我们需要识别出哪些值是异常值或离群点,其次如何处理这些异常值。下面仍然以案例的形式,给大家讲讲异常值的处理: 目录  1、识别异常 ...

Tue May 24 00:26:00 CST 2016 0 4729
R语言-数据整形之dplyr

R语言dplyr包 前言   2014年刚到, 就在 Feedly 订阅里看到 RStudio Blog 介绍 dplyr 包已发布 (Introducing dplyr), 此包将原本 plyr 包中的 ddply() 等函数进一步分离强化, 专注接受dataframe对象, 大幅提高了速度 ...

Wed Jun 08 17:59:00 CST 2016 0 2800
数据处理包plyr和dplyr包的整理

以下内容主要参照 Introducing dplyrdplyr 包自带的简介 (Introduction to dplyr), 复制了原文对应代码, 并夹杂了个人理解和观点 (多附于括号内). 0 初始化0.1 安装 install.packages("dplyr") 0.2 示范数据 ...

Thu Mar 02 01:17:00 CST 2017 0 3039
 
粤ICP备18138465号  © 2018-2025 CODEPRJ.COM