例子
小明稱體重發現自己有94斤,之前都是90的,小明想看看跟90有沒有具體的差異。
- 90斤的條件下, W~N(90,4) 現在進行正態分布標准化 (w - 90)/ 2 ~ N(0,1)
- 置信水平 95% 或者 99% ,Z~N(0,1) 且Z有95%的可能性位於區間接受域【-1.96,1.96】=0.95[1.96通過累積密度函數得來] 還有拒絕域
- 概率密度函數pdf => 離散型隨機變量+ 連續型隨機變量【 =1 】
https://blog.csdn.net/hhaowang/article/details/83898881
得出94斤拒絕原假設 如果置信區域設置在99% 無法拒絕
總結步驟
皮爾遜相關系數
前兩步
后兩步
一般取95% 查表 臨界值表 n 自由度
對N個隨機樣本而言,自由度df=n-k。其中n為樣本數量,k為被限制的條件數或變量個數
**的意思
通過SPSS 軟件也可進行皮爾遜相關系數分析
得到答案 可視化跟顯著性二選一
條件
需要檢驗正態分布
正態分布JB檢驗 【n>30】
偏度的介紹
采用代碼進行檢驗
[h , p ] = jbtest(Test(:,1),0.01) 都是1 拒絕原假設 不是正態分布 樣本> 30
夏皮洛-威爾克檢驗 3 < n < 50
利用spss 軟件
解得 最后一列為p值 看看接近0 不 為0拒絕原假設
Q_Q圖 小樣本不要用QQ圖
qqplot
描述性統計 -> 正態性檢驗 如果沒有通過檢驗 就用 斯皮爾曼系數
看散點圖 看看有沒有線性的趨勢 有線性關系就可算出斯皮爾曼
需要用假設檢驗的話要 檢驗正態分布
相同的話取平均值 大於0 正相關 小於0 負相關 越大相關性越強
第一種斯皮爾曼相關系數 被定義為等級之間的皮爾遜相關系數 行向量 微小差別為同值為同位
第二種 X 和 Y 都要為列向量 行向量運算為 NaN 異常
RX = [2 5 3 4 1];
RY = [1 4.5 3 4.5 2];
R = corrcoef(RX , RY)
RX = [3 8 4 7 2];
RY = [5 10 9 10 6 ];
R = corr(RX , RY , 'type','Spearman')
%兩種答案相同說明 matlab 按照第二種皮爾遜那種進行計算
小樣本 需要進行查表
大樣本
591 -> 樣本數
通過 (1- normcdf( R ) * 2) 得出
或者