皮尔逊相关系数
描述性统计
一、使用MATLAB进行描述性统计
二、使用SPSS进行描述性统计
1.SPSS破解版下载地址:
https://www.52pojie.cn/thread-1025101-1-1.html?tdsourcetag=s_pctim_aiomsg
2.导入数据
3.分析
选择你想要统计的指标,点击确定
得到描述性统计表格。
皮尔逊相关系数的计算
1.用SPSS生成散点图
图形-旧对话框-散点图/点图-矩阵散点图-定义-将变量全部移到右边-确定
生成如下散点图:
若从散点图中能够看到两个变量之间呈大概的线性关系,则计算其相关系数;否则判断其线性相关程度低。
2.用MATLAB计算相关系数
点击查看代码
clear;clc
load 'physical fitness test.mat' %文件名如果有空格隔开,那么需要加引号
% https://ww2.mathworks.cn/help/matlab/ref/corrcoef.html
%% 统计描述
MIN = min(Test); % 每一列的最小值
MAX = max(Test); % 每一列的最大值
MEAN = mean(Test); % 每一列的均值
MEDIAN = median(Test); %每一列的中位数
SKEWNESS = skewness(Test); %每一列的偏度
KURTOSIS = kurtosis(Test); %每一列的峰度
STD = std(Test); % 每一列的标准差
RESULT = [MIN;MAX;MEAN;MEDIAN;SKEWNESS;KURTOSIS;STD] %将这些统计量放到一个矩阵中表示
%% 计算各列之间的相关系数
% 在计算皮尔逊相关系数之前,一定要做出散点图来看两组变量之间是否有线性关系
% 这里使用Spss比较方便: 图形 - 旧对话框 - 散点图/点图 - 矩阵散点图
R = corrcoef(Test) % correlation coefficient
3.美化相关系数表
将得到的R复制到excel表格中,加上指标名
对皮尔逊相关系数进行假设检验
一、假设检验
点击查看代码
%% 假设检验部分
x = -4:0.1:4;
y = tpdf(x,28); %求t分布的概率密度值 28是自由度
figure(1)
plot(x,y,'-')
grid on % 在画出的图上加上网格线
hold on % 保留原来的图,以便继续在上面操作
一个:置信水平为90%水平上越显著地异于0
两个:置信水平为95%水平上越显著地异于0
三个:置信水平为99%水平上越显著地异于0
用SPSS标记置信水平的个数
分析-相关-双变量-所有指标移到右边
(双尾为双侧检验,单尾为单侧检验)
二、假设检验条件
数据服从正态分布。
检验数据是否服从正态分布
一、正态分布JB检验(大样本 n>30)
MATLAB中进行JB检验的语法:[h,p] = jbtest(x,alpha)
当输出h等于1时,表示拒绝原假设;h等于0则代表不能拒绝原假设。
alpha就是显著性水平,一般取0.05,此时置信水平为1‐0.05=0.95
x就是我们要检验的随机变量,注意这里的x只能是向量。
点击查看代码
%% 正态分布检验
% 检验第一列数据是否为正态分布
[h,p] = jbtest(Test(:,1),0.05)
% 用循环检验所有列的数据
n_c = size(Test,2); % number of column 数据的列数
H = zeros(1,6);
P = zeros(1,6);
for i = 1:n_c
[h,p] = jbtest(Test(:,i),0.05);//Test为数据矩阵,Test(:,i)是矩阵的第一列
H(i)=h;
P(i)=p;
end
disp(H)
disp(P)
二、Shapiro-wilk夏皮洛‐威尔克检验(小样本3≤n≤50)
三、Q-Q图
在统计学中,Q‐Q图(Q代表分位数Quantile)是一种通过比较两个概率分布的分位数对这两个概率分布进行比较的概率图方法。
首先选定分位数的对应概率区间集合,在此概率区间上,点(x,y)对应于第一个分布的一个分位数x和第二个分布在和x相同概率区间上相同的分位数。这里,我们选择正态分布和要检验的随机变量,并对其做出QQ图,可想而知,如果要检验的随机变量是正态分布,那么QQ图就是一条直线。
要利用Q‐Q图鉴别样本数据是否近似于正态分布,只需看Q‐Q图上的点是否近似地在一条直线附近。(要求数据量非常大)
点击查看代码
qqplot(Test(:,1))