相關系數的檢驗主要有兩種方法,一種是對假設 “相關系數ρ=0” 的t檢驗,另一種是對假設 “相關系數ρ≠0”的z檢驗。
關於t檢驗(檢驗r是否顯著,即檢驗r是否不等於零)
| 1 | 根據r和n計算得到t |
| 2 | 查表得到 在 顯著性水平α和自由度(n-2)下,t分布的上α分位點tα/2 |
| 3 | 判斷t>tα/2是否成立,若成立,則r是顯著的 |
關於z檢驗
此法目的如下,假設相關系數等於ρ,經過一系列步驟,計算出該假設在顯著性水平α下為真的置信區間(通俗的講,就是計算得到一個范圍(rlow,rhi),如果要檢驗的相關系數落在這個范圍內(rlow<r<rhi),那么原來的假設(相關系數=ρ)有(1-α)的把握成立)。
| 1 | 計算r對應的z統計量zr (fisher變換) |
| 2 | 計算ρ對應的z統計量zρ (fisher變換) |
| 3 | 計算zr和zρ的差 |zr-zρ|,標准誤SE=1/sqrt(N-3) |
| 4 | 查表得到 給定顯著性水平α下,標准正態分布的上α分位點zα/2 |
| 5 | 判斷|zr-zρ|/sqrt(N-3)>zα/2是否成立,若成立,則原假設有(1-α)的把握成立 |
z檢驗的變體
| 1 | 計算z統計量 (r->z, fisher變換) : z=0.5*ln((1+r)/(1-r)) |
| 2 | 查表找到顯著水平α下,標准正態分布的上α分位點zα/2 |
| 3 | z統計量的標准差σ=1/sqrt(N-3) |
| 4 | z的下限和上限 z-(zα/2)*σ, z+(zα/2)*σ |
| 5 | 用fisher逆變換(r=(exp(2*z)-1)/(exp(2*z)+1))得到r的下限和上限。 |
參考資料
http://student.zjzk.cn/course_ware/web_xlyjytjx/skxt/chap0705.htm
http://www.ncl.ucar.edu/Document/Functions/Built-in/escorc.shtml
相關系數顯著性檢驗的臨界值r
另外,關於相關系數顯著性檢驗的臨界值r的計算,我以前存在了誤區:計算t統計量時用的這個公式:t=r*sqrt(n-2/(1-r2)),我誤以為可以通過此公式從t的臨界值反推得到r的臨界值。但是計算出的r值始終和書上的不一樣。今天終於發現了問題所在,相關系數的臨界值不能使用這種方法計算。正確的計算方法如下(參考 http://blog.sina.com.cn/s/blog_4d69c7430100ziqf.html)
1 計算總平方和SST、回歸平方和SSR和殘差平方和SSE
1 計算F統計量 F=(n-k-1)/k*((SSR)/(SST-SSR)) 注:在兩個樣本的相關系數的情況下,k=1
2 計算r的臨界值 r=sqrt(k*F/(k*F+n-k-1))
