第一章 R语言介绍 读取,设置当前工作区 setwd("E:\\Desktop\\R Language\\R") getwd() 特殊显示格式 > options(digits=3) #显示小数点后三位 > x<-runif(20) ? > x [1] 0.329 ...
K近邻算法 KNN 是指一个样本如果在特征空间中的K个最相邻的样本中的大多数属于某一个类别,则该样本也属于这个类别,并具有这个类别上样本的特性。即每个样本都可以用它最接近的k个邻居来代表。KNN算法适合分类,也适合回归。KNN算法广泛应用在推荐系统 语义搜索 异常检测。 KNN算法分类原理图: 图中绿色的圆点是归属在红色三角还是蓝色方块一类 如果K 离绿色圆点最近的 个邻居,虚线圈内 ,则有 个蓝 ...
2018-04-30 22:32 0 3850 推荐指数:
第一章 R语言介绍 读取,设置当前工作区 setwd("E:\\Desktop\\R Language\\R") getwd() 特殊显示格式 > options(digits=3) #显示小数点后三位 > x<-runif(20) ? > x [1] 0.329 ...
参考:W.N. Venables, D.M. Smith and the R DCT: Introduction to R -- Notes on R: A Programming Environment for Data Analysis and Graphics, 2003. http ...
仅用于记录R语言学习过程: 内容提要: 自定义函数:function()函数,缺省参数(...) 数据的读取:文本,excel,SPSS,SAS,STATA格式; 主要的函数有:read.csv()、read.table()、readxl包中的read_excel()函数 ...
摘要: 仅用于记录R语言学习过程: 内容提要: 数据排序:sort()函数、rank()函数、order()函数; 长宽型数据的转换:stack()函数、reshape()函数、reshape2扩展包中的函数:melt()函数、dcast()函数 变量的因子化:factor()函数、cut ...
第四,五章学习总结,这两章主要讲解了R语言的系统函数,例如怎么把缺失值剔除,数据类型的识别和转换,数据集的合并,怎么使用SQL库,函数以及R程序的顺序,选择和循环的实现方式。 缺失值 > manager <- c(1,2,3,4,5) > date<-c ...
R语言支持很多图形,并且有些图形是非常少见的,可能也因为自己不是专业弄数据分析的所以就孤陋寡闻了,总结下目前学习到的图形。 条形图 这个图比较常见,很多数据统计软件都支持这种图形,这种图形可以很好的展示数据的汇总结果,可以简洁明了的方式表达数据背后的含义 > ...
总结下第七章的统计分析方法,里面涉及到了很多统计专业概念。 Summary 函数 > myvars<-c("mpg","hp","wt") > summary(mtcars[ ...
摘要: 仅用于记录R语言学习过程: 内容提要: 时间与日期数据的处理; lubridate包; 时间序列介绍及举例 正文: 时间与日期数据的处理 n 导读: u 时间生成函数:as.Date() > as.Date('2017-02-16 ...