corr
描述
例子
查找兩個矩陣之間的相關性
找到兩個矩陣之間的相關性,並將其與兩個列向量之間的相關性進行比較。
生成樣本數據。
rng('默認') X = randn(30,4); Y = randn(30,4);
介紹矩陣第二X列與矩陣第四列之間的相關性Y。
Y(:,4)= Y(:,4)+ X(:,2);
計算X和的列之間的相關性Y。
[rho,pval] = corr(X,Y)
rho = 4×4 -0.1686 -0.0363 0.2278 0.3245 0.3022 0.0332 -0.0866 0.7653 -0.3632 -0.0987 -0.0200 -0.3693 -0.1365 -0.1804 0.0853 0.0279
pval = 4×4 0.3731 0.8489 0.2260 0.0802 0.1045 0.8619 0.6491 0.0000 0.0485 0.6039 0.9166 0.0446 0.4721 0.3400 0.6539 0.8837
正如預期的那樣,兩列之間的相關系數X和列四個Y,rho(2,4),是最高的,並且它代表了兩列之間的高的正相關性。對應的p值pval(2,4)對於所示的四位數為零。由於p值小於的顯着性水平0.05,因此表明拒絕了兩列之間不存在相關性的假設。
計算之間的相關性X和Y使用corrcoef。
[r,p] = corrcoef(X,Y)
r = 2×2 1.0000 -0.0329 -0.0329 1.0000
p = 2×2 1.0000 0.7213 0.7213 1.0000
的MATLAB®功能corrcoef,不像corr功能,將輸入的矩陣X和Y成列向量,X(:)並且Y(:),計算它們之間的相關性之前。因此,不再需要在矩陣的第二X列與矩陣的第四列之間引入相關性Y,因為這兩列位於轉換后的列向量的不同部分中。
的非對角元素的值r,其表示之間的相關系數X和Y,是低的。此值表示X和之間幾乎沒有相關性Y。同樣,的非對角線元素的值(p表示p值)比的顯着性水平高得多0.05。該值表明沒有足夠的證據來拒絕X和之間沒有相關性的假設Y。
測試相關性的假設
測試兩個矩陣的列之間的正,負和非零相關性的替代假設。分別比較相關系數的值和p值。
生成樣本數據。
rng('默認') X = randn(50,4); Y = randn(50,4);
在矩陣的第一X列和矩陣的第四列之間引入正相關Y。
Y(:,4)= Y(:,4)+ 0.7 * X(:,1);
在的第二列X和的第二列之間引入負相關Y。
Y(:,2)= Y(:,2)-2 * X(:,2);
測試相關性大於零的替代假設。
[rho,pval] = corr(X,Y,'Tail','right')
rho = 4×4 0.0627 -0.1438 -0.0035 0.7060 -0.1197 -0.8600 -0.0440 0.1984 -0.1119 0.2210 -0.3433 0.1070 -0.3526 -0.2224 0.1023 0.0374
pval = 4×4 0.3327 0.8405 0.5097 0.0000 0.7962 1.0000 0.6192 0.0836 0.7803 0.0615 0.9927 0.2298 0.9940 0.9397 0.2398 0.3982
正如預期的那樣,列之一之間的相關系數X和列四個Y,rho(1,4)具有最高正值,表示兩列之間的高的正相關性。對應的p值,pval(1,4)對於所示的四位數為零,低於的顯着性水平0.05。這些結果表明拒絕了兩列之間不存在相關性的零假設,並得出了相關性大於零的結論。
測試相關性小於零的替代假設。
[rho,pval] = corr(X,Y,'Tail','left')
rho = 4×4 0.0627 -0.1438 -0.0035 0.7060 -0.1197 -0.8600 -0.0440 0.1984 -0.1119 0.2210 -0.3433 0.1070 -0.3526 -0.2224 0.1023 0.0374
pval = 4×4 0.6673 0.1595 0.4903 1.0000 0.2038 0.0000 0.3808 0.9164 0.2197 0.9385 0.0073 0.7702 0.0060 0.0603 0.7602 0.6018
正如預期的那樣,兩列之間的相關系數X和列兩個Y,rho(2,2),具有最大絕對值(負數-0.86),代表兩列之間的高的負相關。對應的p值,pval(2,2)對於所示的四位數為零,低於的顯着性水平0.05。同樣,這些結果表明對原假設的拒絕,並得出結論,相關性小於零。
測試相關性不為零的替代假設。
[rho,pval] = corr(X,Y)
rho = 4×4 0.0627 -0.1438 -0.0035 0.7060 -0.1197 -0.8600 -0.0440 0.1984 -0.1119 0.2210 -0.3433 0.1070 -0.3526 -0.2224 0.1023 0.0374
pval = 4×4 0.6654 0.3190 0.9807 0.0000 0.4075 0.0000 0.7615 0.1673 0.4393 0.1231 0.0147 0.4595 0.0120 0.1206 0.4797 0.7964
的p -值,pval(1,4)和pval(2,2),均為零所示的四位數字。由於p值低於的顯着性水平0.05,因此相關系數rho(1,4)和rho(2,2)明顯不同於零。因此,原假設被拒絕;相關性不為零。
輸入參數
X— 輸入矩陣
矩陣
輸入矩陣,指定為n × k 矩陣。的行X對應於觀測值,列對應於變量。
例: X = randn(10,5)
數據類型:single |double
Y— 輸入矩陣
矩陣
輸入矩陣,指定為 ñ -by- ķ 2 矩陣時X被指定為一個 ñ -by- ķ 1 矩陣。的行Y對應於觀測值,列對應於變量。
例: Y = randn(20,7)
數據類型:single |double
名稱-值對參數
指定可選的逗號分隔的Name,Value參數對。Name是參數名稱,Value是對應的值。 Name必須出現在引號內。您可以按任意順序指定幾個名稱和值對參數 Name1,Value1,...,NameN,ValueN。
corr(X,Y,'Type','Kendall','Rows','complete')僅使用不包含缺失值的行來返回Kendall的tau相關系數。
'Rows'— 用於計算的行
'all'(默認)| 'complete'|'pairwise'
'Tail'— 替代假設
'both'(默認)| 'right'|'left'
替代假設,指定為以逗號分隔的一對,由'Tail'表中的值和組成。'Tail'指定用於計算p值以測試無相關假設的替代假設。
| 值 | 描述 |
|---|---|
'both' |
測試相關性不是的替代假設0。 |
'right' |
測試相關性大於 0 |
'left' |
測試相關性小於的替代假設0。 |
corr計算p為通過加倍兩個單尾的更顯著的雙尾檢驗-值p -值。
例: 'Tail','left'
輸出參數
更多關於
皮爾遜線性相關系數
皮爾森線性相關系數是最常用的線性相關系數。對於矩陣X的X a列 和矩陣Y的Y b列,均值和,皮爾遜線性相關系數 rho(a,b)定義為:〜〜X一=Ñ我=1(X一,我)/Ñ,〜〜ÿb=ÑĴ=1(Xb,Ĵ)/Ñ
ř ħ Ô (一,b ) = Ñ我=1(X一,我 - 〜〜X一)(Ýb ,我 - 〜〜ÿb){Ñ我=1(X一,我 - 〜〜X一)2ÑĴ=1(Ýb,Ĵ- 〜〜Ÿb)
