對“Gary.csv”中的成績數據進行統計量分析
基礎數據分析
均值 中位數 極差 標准差 變異系數 1/4分位數 3/4分位數 四分位間距... ...分析

setwd('D:\\data') #更改工作目錄 list.files() #列出當前工作目錄下的文件 dat=read.csv(file="Gary.csv",header=TRUE) #讀取"Gary.csv文件" dats=dat[,3] #對大學體育成績進行分析 # 統計量分析 #平均分 mean_ = mean(dats,na.rm=T) # 中位數 median_ = median(dats,na.rm=T) # 極差 range_ = max(dats,na.rm=T)-min(dats,na.rm=T) # 標准差 std_ = sqrt(var(dats,na.rm=T)) # 變異系數 variation_ = std_/mean_ # 四分位數間距 q1 = quantile(dats,0.25,na.rm=T) q3 = quantile(dats,0.75,na.rm=T) distance = q3-q1 a=matrix(c(mean_,median_,range_,std_,variation_,q1,q3,distance),1,byrow=T) colnames(a)=c("均值","中位數","極差","標准差","變異系數","1/4分位數","3/4分位數","四分位間距") print(a)
平均值mean(x, trim = 0, na.rm = FALSE, ...) 傳送門
x - 是輸入向量。
trim - 用於從排序的向量的兩端刪除一些觀測值。
na.rm - 用於從輸入向量中刪除缺少的值。
中位數median(x, na.rm = FALSE)
x - 是輸入向量。
na.rm - 用於從輸入向量中刪除缺少的值。
線性回歸 傳送門
多元回歸
邏輯回歸
正態分布 傳送門
二項分布 傳送門
泊松回歸 傳送門
協方差分析
時間序列分析
非線性最小二乘法
決策樹 傳送門
隨機森林
生存分析卡方檢驗