1 高级数据管理
1.1 数值和字符处理函数
(1)数学函数
绝对值函数:abs()
取整函数:floor(),取不大于这个数的整数
取对数函数:log(),log10()
四舍五入函数:round()
(2)统计函数
均值函数:mean()
方差函数:var()
标准差函数:sd()
分位数函数:quantile()
x<-quantile(c(1,2,3,4,5,6,7,8,9,10),c(0.2,0.8))
解释:c(0.2,0.8)求这些向量的20%的分位数和80%的分位数
(3)概率函数
beta分布:beta
正态分布:norm
柯西分布:cauchy
密度函数:d=
分布函数:p=
分位数函数:q=
生成随机数:r=
正太密度函数使用:
x<-pretty(c(-3,3),30)
解释:pretty是最优分等点,使分出来的数字尽量不会太多小数点,c(-3,3)设置了数的范围为-3到3,30分为30个等份
y<-dnorm(x) #x的密度正太分布函数
plot(x,y,type = "l")
正太分布函数:求1.96这个值在标准正太分布曲线下对应的面积使多少
正太分位数函数:求均值为500,标准差为100的正太分布,它的90%分位点对应的x是多少
生成随机数:生成10个均值为5,标准差为5的随机数
例子:
library("MASS")
options(digits = 3)
set.seed(123)
mean<-c(230.7,146.7,3.6)
sigma<-matrix(c(15260.8,6721.2,-47.1,6721.2,4700.9,-16.5,-47.1,-16.5,0.3),nrow=3,ncol=3)
mydata<-mvrnorm(50000,mean,sigma) #生成5万个均值是mean,协方差是sigma的矩阵
mydata<-as.data.frame(mydata) #把矩阵转成数据框
names(mydata)<-c("y","x1","x2") #对数据框取名字
(4)字符处理函数
计算字符串长度:nchar()
截取字符串长度:substr()
(5)其他实用函数
长度函数:length()
生成一个序列的函数:seq()
重复函数:rep()
(6)将函数用于矩阵和数据框
四舍五入函数:round()
随机数矩阵:matrix() ,runif()
随机生成一个3行4列的12个数字的矩阵
对矩阵求矩阵(整体):mean()
矩阵按行求均值:apply() ,参数设置为1
矩阵按列求均值:apply() ,参数设置为2