R_Studio(學生成績)數據相關性分析


 

 

  對“Gary.csv”中的成績數據進行統計量分析

  

 

  

    

  用cor函數來計算相關性,method默認參數是用pearson;並且遇到缺失值,use默認參數everything,結果會是NA

 

相關性分析

  當值r>1時,正相關,一個變量增加或減少時,另一個變量也相應增加或減少

  當值r=1時,無相關,說明兩個變量相互獨立,有一個變量值無法預測另一個變量值

  當值r<1時,負相關,一個變量增加或減少時,另一個變量也相應減少或增加

 

  相關系數取值范圍限於: -1 <= r <= +1

 

 

 

  好嚴格的對稱性

  如果只想看大學體育和大學英語 相關性系數

  小case!

 

 

setwd('D:\\data')                            #更改工作目錄
list.files()                                #列出當前工作目錄下的文件
dat=read.csv(file="Gary.csv",header=TRUE) 

cor(dat)

plot(dat)

#大學體育 大學英語 相關性系數
cor(dat[,1],dat[,2])

#繪圖
plot(dat[,1],dat[,2])
Gary.R

 

 

 可視化相關性分析  傳送門

  [1] 使用 symnum() 函數實現可視化

  [2] 使用 corrplot() 函數實現可視化

  [3] 使用 PerformanceAnalytics 包進行可視化

  [4] heatmap 可視化

 


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM