皮爾遜相關系數




描述性統計
一、使用MATLAB進行描述性統計

二、使用SPSS進行描述性統計
1.SPSS破解版下載地址:
https://www.52pojie.cn/thread-1025101-1-1.html?tdsourcetag=s_pctim_aiomsg
2.導入數據

3.分析

選擇你想要統計的指標,點擊確定

得到描述性統計表格。
皮爾遜相關系數的計算
1.用SPSS生成散點圖
圖形-舊對話框-散點圖/點圖-矩陣散點圖-定義-將變量全部移到右邊-確定
生成如下散點圖:

若從散點圖中能夠看到兩個變量之間呈大概的線性關系,則計算其相關系數;否則判斷其線性相關程度低。
2.用MATLAB計算相關系數
點擊查看代碼
clear;clc
load 'physical fitness test.mat' %文件名如果有空格隔開,那么需要加引號
% https://ww2.mathworks.cn/help/matlab/ref/corrcoef.html
%% 統計描述
MIN = min(Test); % 每一列的最小值
MAX = max(Test); % 每一列的最大值
MEAN = mean(Test); % 每一列的均值
MEDIAN = median(Test); %每一列的中位數
SKEWNESS = skewness(Test); %每一列的偏度
KURTOSIS = kurtosis(Test); %每一列的峰度
STD = std(Test); % 每一列的標准差
RESULT = [MIN;MAX;MEAN;MEDIAN;SKEWNESS;KURTOSIS;STD] %將這些統計量放到一個矩陣中表示
%% 計算各列之間的相關系數
% 在計算皮爾遜相關系數之前,一定要做出散點圖來看兩組變量之間是否有線性關系
% 這里使用Spss比較方便: 圖形 - 舊對話框 - 散點圖/點圖 - 矩陣散點圖
R = corrcoef(Test) % correlation coefficient
3.美化相關系數表
將得到的R復制到excel表格中,加上指標名

對皮爾遜相關系數進行假設檢驗
一、假設檢驗




點擊查看代碼
%% 假設檢驗部分
x = -4:0.1:4;
y = tpdf(x,28); %求t分布的概率密度值 28是自由度
figure(1)
plot(x,y,'-')
grid on % 在畫出的圖上加上網格線
hold on % 保留原來的圖,以便繼續在上面操作

一個:置信水平為90%水平上越顯著地異於0
兩個:置信水平為95%水平上越顯著地異於0
三個:置信水平為99%水平上越顯著地異於0
用SPSS標記置信水平的個數
分析-相關-雙變量-所有指標移到右邊
(雙尾為雙側檢驗,單尾為單側檢驗)

二、假設檢驗條件
數據服從正態分布。
檢驗數據是否服從正態分布
一、正態分布JB檢驗(大樣本 n>30)

MATLAB中進行JB檢驗的語法:[h,p] = jbtest(x,alpha)
當輸出h等於1時,表示拒絕原假設;h等於0則代表不能拒絕原假設。
alpha就是顯著性水平,一般取0.05,此時置信水平為1‐0.05=0.95
x就是我們要檢驗的隨機變量,注意這里的x只能是向量。
點擊查看代碼
%% 正態分布檢驗
% 檢驗第一列數據是否為正態分布
[h,p] = jbtest(Test(:,1),0.05)
% 用循環檢驗所有列的數據
n_c = size(Test,2); % number of column 數據的列數
H = zeros(1,6);
P = zeros(1,6);
for i = 1:n_c
[h,p] = jbtest(Test(:,i),0.05);//Test為數據矩陣,Test(:,i)是矩陣的第一列
H(i)=h;
P(i)=p;
end
disp(H)
disp(P)
二、Shapiro-wilk夏皮洛‐威爾克檢驗(小樣本3≤n≤50)


三、Q-Q圖
在統計學中,Q‐Q圖(Q代表分位數Quantile)是一種通過比較兩個概率分布的分位數對這兩個概率分布進行比較的概率圖方法。
首先選定分位數的對應概率區間集合,在此概率區間上,點(x,y)對應於第一個分布的一個分位數x和第二個分布在和x相同概率區間上相同的分位數。這里,我們選擇正態分布和要檢驗的隨機變量,並對其做出QQ圖,可想而知,如果要檢驗的隨機變量是正態分布,那么QQ圖就是一條直線。
要利用Q‐Q圖鑒別樣本數據是否近似於正態分布,只需看Q‐Q圖上的點是否近似地在一條直線附近。(要求數據量非常大)
點擊查看代碼
qqplot(Test(:,1))
