R_Studio(學生成績)對數值型數據進行統計量分析


 

 

  對“Gary.csv”中的成績數據進行統計量分析

 

 

 基礎數據分析

  均值 中位數 極差   標准差   變異系數 1/4分位數 3/4分位數 四分位間距... ...分析

 

 

 

setwd('D:\\data')                            #更改工作目錄
list.files()                                #列出當前工作目錄下的文件
dat=read.csv(file="Gary.csv",header=TRUE)    #讀取"Gary.csv文件"

dats=dat[,3]     #對大學體育成績進行分析

# 統計量分析
#平均分
mean_ = mean(dats,na.rm=T)
# 中位數
median_ = median(dats,na.rm=T)
# 極差
range_ = max(dats,na.rm=T)-min(dats,na.rm=T)
# 標准差
std_ = sqrt(var(dats,na.rm=T))
# 變異系數
variation_ = std_/mean_
# 四分位數間距
q1 = quantile(dats,0.25,na.rm=T)
q3 = quantile(dats,0.75,na.rm=T)
distance = q3-q1
a=matrix(c(mean_,median_,range_,std_,variation_,q1,q3,distance),1,byrow=T)
colnames(a)=c("均值","中位數","極差","標准差","變異系數","1/4分位數","3/4分位數","四分位間距")
print(a) 
Gary.R

 

 平均值mean(x, trim = 0, na.rm = FALSE, ...)  傳送門

   x - 是輸入向量。

  trim - 用於從排序的向量的兩端刪除一些觀測值。

    na.rm - 用於從輸入向量中刪除缺少的值。

 

中位數median(x, na.rm = FALSE) 

   x - 是輸入向量。 

  na.rm - 用於從輸入向量中刪除缺少的值。

 

 

 

 

其它數據分析方法  

  線性回歸  傳送門

  多元回歸

  邏輯回歸

  正態分布  傳送門

  二項分布  傳送門

  泊松回歸  傳送門

  協方差分析

  時間序列分析

  非線性最小二乘法

  決策樹  傳送門

  隨機森林

  生存分析卡方檢驗

 


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM