花费 63 ms
R实战 第九篇:数据标准化

数据标准化处理是数据分析的一项基础工作,不同评价指标往往具有不同的量纲,数据之间的差别可能很大,不进行处理会影响到数据分析的结果。为了消除指标之间的量纲和取值范围差异对数据分析结果的影响,需要对数据进 ...

Fri Aug 10 01:02:00 CST 2018 0 14065
R实战 第五篇:常用函数的用法

Basic包是R语言预装的开发包,包含了常用的数据处理函数,可以对数据进行简单地清理和转换,也可以在使用其他转换函数之前,对数据进行预处理,必须熟练掌握常用的数据处理函数。 一,合并向量 函数ap ...

Wed Mar 21 01:22:00 CST 2018 0 14116
R实战 第十篇:列联表和频数表

列联表是观测数据按两个或更多属性(定性变量)分类时所列出的频数分布表,它是由两个以上的变量进行交叉分类的频数分布表。交互分类的目的是将两变量分组,然后比较各组的分布状况,以寻找变量间的关系。 按两个 ...

Wed Sep 19 18:21:00 CST 2018 2 10536
R实战 第六篇:数据变换(aggregate+dplyr)

数据分析的工作,80%的时间耗费在处理数据上,而数据处理的主要过程可以分为:分离-操作-结合(Split-Apply-Combine),也就是说,首先,把数据根据特定的字段分组,每个分组都是独立的;然 ...

Sat Nov 04 19:42:00 CST 2017 0 6792
R实战 第八篇:重塑数据(reshape2)

数据重塑通常使用reshape2包,reshape2包用于实现对宽数据及长数据之间的相互转换,由于reshape2包不在R的默认安装包列表中,在第一次使用之前,需要安装和引用: 重塑数 ...

Wed Jul 18 19:15:00 CST 2018 0 4901
R实战 第四篇:数据处理(数据框)

在实际分析数据之前,必须对数据进行清理和转化,使数据符合相应的格式,提高数据的质量。数据处理通常包括增加新的变量、处理缺失值、类型转换、数据排序、数据集的合并和获取子集等。 一,增加新的变量 通常 ...

Mon Mar 05 20:04:00 CST 2018 1 5699
R实践 第二篇:创建数据集

准备数据是数据分析的第一步,由数据构成集合,我们称作数据集,数据集的结构是行列式的,行表示观测,列表示变量。把数据读入到R中,转换为合适的数据结构,能够提高数据分析的效率。在数据分析中,常用的存储数据 ...

Tue Mar 06 16:30:00 CST 2018 1 3091
R实战 第11篇:处理缺失值

在真实的世界中,缺失数据是经常出现的,并可能对分析的结果造成影响。在R中,经常使用VIM(Visualization and Imputation of Missing values)包来对缺失值进行 ...

Wed Sep 19 19:28:00 CST 2018 0 2264
R实战 第七篇:plyr包

在数据分析中,整理数据的本质可以归纳为:对数据进行分割(Split),然后应用(Apply)某些处理函数,最后将结果重新组合(Combine)成所需的格式返回,简单描述为:Split - Apply ...

Wed Apr 11 01:19:00 CST 2018 0 2558
R实战 开篇:介绍R的使用

R是专门用于数据分析和统计的脚本语言,广泛应用在每一个需要统计和数据分析的领域。使用R做数据建模、数据统计和分析是一个发现未知和惊喜的旅程,前提,你必须迈出第一步,去学习R语言。R是一种解释型语言,这 ...

Fri Mar 02 18:29:00 CST 2018 0 1711

 
粤ICP备18138465号  © 2018-2025 CODEPRJ.COM