介绍 一、实验说明 1. 环境登录 无需密码自动登录,系统用户名shiyanlou,密码shiyanlou 2. 环境介绍 本实验环境采用带桌面的Ubuntu Linux环境,实验中会用到程 ...
数据的清理 如同列夫托尔斯泰所说的那样: 幸福的家庭都是相似的,不幸的家庭各有各的不幸 ,糟糕的恶心的数据各有各的糟糕之处,好的数据集都是相似的。一份好的,干净而整洁的数据至少包括以下几个要素: 每一个观测变量构成一列 每一个观测对象构成一行 每一个类型的观测单元构成一个表就像我们最常接触的鸢尾花数据: 每一列就是观测的指标:花瓣长度,花瓣宽度,萼片长度,萼片宽度,种类 每一行就是一株鸢尾花的观测 ...
2015-10-20 14:32 0 11126 推荐指数:
介绍 一、实验说明 1. 环境登录 无需密码自动登录,系统用户名shiyanlou,密码shiyanlou 2. 环境介绍 本实验环境采用带桌面的Ubuntu Linux环境,实验中会用到程 ...
时间序列与数据挖掘 一、实验说明 1. 环境登录 无需密码自动登录,系统用户名shiyanlou,密码shiyanlou 2. 环境介绍 本实验环境采用带桌面的Ubuntu Linux环境,实验中会用到: 1. LX终端(LXTerminal): Linux命令行终端,打开后会 ...
前面写过一个多分类的逻辑回归,现在要做一个简单的二分类,用glm函数 导入csv格式如下: mydata<-read.csv("D://li.csv",header=T ...
参考如下的链接: https://technet.microsoft.com/en-us/library/ff630161(v=ws.10).aspx 运行后可能没有啥反应,磁盘空间也没增大。那是因为没有重启。重启后清理就会执行和生效。 ...
摘自:吴喜之:《非参数统计》(第二版),中国统计出版社,2006年10月:P164-165 1、ks.test() 例如零假设为N(15,0.2),则ks.test(x,"pnorm",15,0. ...
数据集——iris(R语言自带鸢尾花包) 一、scale函数 scale函数默认的是对制定数据做均值为0,标准差为1的标准化。它的两个参数center和scale: 1)center和scale默认为真,即T 2)center为真表示数据中心化 3)scale为真表示数据标准化 中心化 ...
衡量随机变量相关性的方法主要有三种:pearson相关系数,spearman相关系数,kendall相关系数: 1. pearson相关系数,亦即皮尔逊相关系数 pearson相关系数用来衡量两个随机变量之间的相关性 R语言中求两个随机变量pearson相关系数的函数 ...
什么是R语言? R是用于统计分析、绘图的语言和操作环境。R是属于GNU系统的一个自由、免费、源代码开放的软件,它是一个用于统计计算和统计制图的优秀工具。 R语言学习网站 Quick R https://www.statmethods.net/ R cookbook http ...