花费 25 ms
如何在R语言中使用Logistic回归模型

在日常学习或工作中经常会使用线性回归模型对某一事物进行预测,例如预测房价、身高、GDP、学生成绩等,发现这些被预测的变量都属于连续型变量。然而有些情况下,被预测变量可能是二元变量,即成功或失败、流失或 ...

Wed Dec 14 01:06:00 CST 2016 1 126064
R----ggplot2包介绍学习

分析数据要做的第一件事情,就是观察它。对于每个变量,哪些值是最常见的?值域是大是小?是否有异常观测? ggplot2图形之基本语法: ggplot2的核心理念是将绘图与数据分离,数据相关的绘图与数 ...

Mon Nov 14 03:31:00 CST 2016 4 88364
简单介绍一下R中的几种统计分布及常用模型

统计学上分布有很多,在R中基本都有描述。因能力有限,我们就挑选几个常用的、比较重要的简单介绍一下每种分布的定义,公式,以及在R中的展示。 统计分布每一种分布有四个函数:d――density(密度函数),p――分布函数,q――分位数函数,r――随机数函数。比如,正态分布 ...

Wed Nov 23 08:12:00 CST 2016 0 76595
python字符串前面加上'r'的作用

在打开文件的时候open(r'c:\....') 加r和不加''r是有区别的 'r'是防止字符转义的 如果路径中出现'\t'的话 不加r的话\t就会被转义 而加了'r'之后'\t'就能保留原有的样子 在字符串赋值的时候 前面加'r'可以防止字符串在时候的时候不被转义 原理是在转义字符前加 ...

Wed Nov 22 06:12:00 CST 2017 2 51144
像Excel一样使用python进行数据分析

Excel是数据分析中最常用的工具,本篇文章通过python与excel的功能对比介绍如何使用python通过函数式编程完成excel中的数据处理及分析工作。在Python中pandas库用于数据处理 ...

Mon Apr 24 21:44:00 CST 2017 2 56119
R语言之Random Forest随机森林

什么是随机森林? 随机森林就是通过集成学习的思想将多棵树集成的一种算法,它的基本单元是决策树,而它的本质属于机器学习的一大分支——集成学习(Ensemble Learning)方法。随机森林的名称中 ...

Wed Feb 08 00:57:00 CST 2017 2 57421
关联规则挖掘算法之Apriori算法

Apriori算法是一种挖掘关联规则的频繁项集算法,其核心思想是通过候选集生成和情节的向下封闭检测两个阶段来挖掘频繁项集。 关于这个算法有一个非常有名的故事:"尿布和啤酒"。故事是这样的:美国的妇女 ...

Thu Feb 09 08:15:00 CST 2017 1 33680
CART决策树(分类回归树)分析及应用建模

一、CART决策树模型概述(Classification And Regression Trees)    决策树是使用类似于一棵树的结构来表示类的划分,树的构建可以看成是变量(属性)选择的过程, ...

Wed Dec 14 02:01:00 CST 2016 1 31212
基于R语言的ARIMA模型

A IMA模型是一种著名的时间序列预测方法,主要是指将非平稳时间序列转化为平稳时间序列,然后将因变量仅对它的滞后值以及随机误差项的现值和滞后值进行回归所建立的模型。ARIMA模型根据原序列是否平稳以 ...

Thu Feb 09 09:22:00 CST 2017 1 29049

 
粤ICP备18138465号  © 2018-2025 CODEPRJ.COM