原文:R语言之数据处理常用包

dplyr包是Hadley Wickham的新作,主要用于数据清洗和整理,该包专注dataframe数据格式,从而大幅提高了数据处理速度,并且提供了与其它数据库的接口 tidyr包的作者是Hadley Wickham, 该包用于 tidy 你的数据,这个包常跟dplyr结合使用。 dplyr tidyr包安装及载入 使用datasets包中的mtcars数据集做演示,首先将过长的数据整理成友好的t ...

2018-03-09 23:51 0 3309 推荐指数:

查看详情

R语言中的数据处理dplyr、tidyr笔记

        R语言中的数据处理dplyr、tidyr笔记 dplyr是Hadley Wickham的新作,主要用于数据清洗和整理,该专注dataframe数据格式,从而大幅提高了数据处理速度,并且提供了与其它数据库的接口;tidyr的作者 ...

Mon Apr 10 04:07:00 CST 2017 0 8730
R语言数据处理dplyr、tidyr笔记

dplyr是Hadley Wickham的新作,主要用于数据清洗和整理,该专注dataframe数据格式,从而大幅提高了数据处理速度,并且提供了与其它数据库的接口;tidyr的作者是Hadley Wickham, 该用于“tidy”你的数据,这个常跟dplyr结合使用。 本文 ...

Tue Nov 29 04:12:00 CST 2016 2 16853
R语言-噪声数据处理

R语言:噪声数据处理 正文   噪声是一个测量变量中的随机错误或偏差,包括错误值或偏离期望的孤立点值。在R中可以通过调用outliers软件中的outlier函数寻找噪声数据,该函数通过寻找数据集中与其他观测值及均值差距最大的点作为异常值,函数的主要形式为:   其中,x表示一个数据 ...

Sat May 21 19:27:00 CST 2016 0 2649
R语言-异常数据处理1

R语言:异常数据处理 前言   在数据处理中,尤其在作函数拟合时,异常点的出现不仅会很大程度的改变函数拟合的效果,而且有时还会使得函数的梯度出现奇异梯度,这就导致算法的终止,从而影响研究变量之间的函数关系。为了有效的避免这些异常点造成的损失,我们需要采取一定的方法对其进行处理,而处理的第一步 ...

Mon May 23 22:53:00 CST 2016 0 6912
R语言-异常数据处理3

R语言:异常数据处理 前言   异常值也是非常痛恨的一类脏数据,异常值往往会拉高或拉低数据的整体情况,为克服异常值的影响,我们需要对异常值进行处理。首先,我们需要识别出哪些值是异常值或离群点,其次如何处理这些异常值。下面仍然以案例的形式,给大家讲讲异常值的处理: 目录  1、识别异常 ...

Tue May 24 00:26:00 CST 2016 0 4729
R语言之常用函数

对一般数据进行运算的常用函数: 数学函数: 1、round() #四舍五入 例:x <- c(3.1416, 15.377, 269.7) round(x, 0) #保留整数位 round(x, 2) #保留两位小数 round(x ...

Thu Mar 19 00:42:00 CST 2020 0 667
R语言-数据处理-样本集划分

library(caret) PS:根据因变量特征值进行数据分区,outp$V1 其中outp为因变量列表,V1为特征值的name 按照p=0.7划分,训练集占70%,测试集占30%,对划分的结果进行描述describe可知 训练集 均值21.45 测试集均值21.75 ...

Fri May 03 18:02:00 CST 2019 0 679
 
粤ICP备18138465号  © 2018-2025 CODEPRJ.COM