對“Gary.csv”中的成績數據進行統計量分析
用cor函數來計算相關性,method默認參數是用pearson;並且遇到缺失值,use默認參數everything,結果會是NA
相關性分析
當值r>1時,正相關,一個變量增加或減少時,另一個變量也相應增加或減少
當值r=1時,無相關,說明兩個變量相互獨立,有一個變量值無法預測另一個變量值
當值r<1時,負相關,一個變量增加或減少時,另一個變量也相應減少或增加
相關系數取值范圍限於: -1 <= r <= +1
好嚴格的對稱性
如果只想看大學體育和大學英語 相關性系數
小case!

setwd('D:\\data') #更改工作目錄 list.files() #列出當前工作目錄下的文件 dat=read.csv(file="Gary.csv",header=TRUE) cor(dat) plot(dat) #大學體育 大學英語 相關性系數 cor(dat[,1],dat[,2]) #繪圖 plot(dat[,1],dat[,2])
可視化相關性分析 傳送門
[1] 使用 symnum() 函數實現可視化
[2] 使用 corrplot() 函數實現可視化
[3] 使用 PerformanceAnalytics 包進行可視化
[4] heatmap 可視化