R語言代寫檢驗獨立性:卡方檢驗(Chi-square test)和費舍爾精確檢驗分析案例報告


統計測試最常見的領域之一是測試列聯表中的獨立性。在這篇文章中,我將展示如何計算列聯表,我將在列聯表中引入兩個流行的測試:卡方檢驗和Fisher精確檢驗。

什么是列聯表?

列聯表提供關於兩個分類變量的測量的整數計數。最簡單的列聯表是一個2 × 22×2 頻率表,由兩個變量產生,每個變量有兩個級別:

組/觀察 觀察1 觀察2
第1組 ñ1 ,1ñ1,1 ñ1 ,2ñ1,2
第2組 ñ2 ,1ñ2,1 ñ2 ,2ñ2,2

給定這樣一個表格,問題是第1組是否表現出與第2組相比的觀測頻率。這些組代表因變量,因為它們依賴於自變量的觀察。請注意,列聯表必須是一種常見的誤解2 × 22×2; 它們可以具有任意數量的維度,具體取決於變量顯示的級別數。盡管如此,應避免對具有多個維度的列聯表進行統計檢驗,因為除其他原因外,解釋結果將具有挑戰性。

 數據集

要研究列聯表的測試,我們將使用warpbreaks數據集:

<span style="color:#000000"><span style="color:#000000"><code>data(warpbreaks)
head(warpbreaks)</code></span></span>
##   breaks wool tension
## 1     26    A       L
## 2     30    A       L
## 3     54    A       L
## 4     25    A       L
## 5     70    A       L
## 6     52    A       L

這是一個包含來自紡織行業的三個變量的數據集:中斷描述了經線中斷的次數,羊毛∈ { A ,B }羊毛∈{一個,乙} 描述了經過測試的羊毛類型 張力∈ { L ,M,H}張力∈{大號,中號,H}給出了施加在螺紋上的張力(低,中或高)。數據集中的每一行表示單個織機的測量值。為了解釋不同織機的可變性,對羊毛張力的每種組合進行了9次測量,數據集總共包含9 ⋅ 2 ⋅ 3 = 549⋅2⋅3=54 觀察結果。

分析目標

我們想確定一種類型的羊毛在不同程度的緊張情況下是否優於另一種羊毛。為了研究我們是否可以找到一些差異的證據,讓我們來看看數據:

為了研究鏈斷裂數的差異,讓我們可視化數據:

從圖中我們可以看出,總體而言,羊毛B與較少的斷裂相關聯。羊毛A似乎特別低劣,因為低張力。

轉換為列聯表

為了獲得列聯表,我們首先需要總結兩種類型的羊毛和三種類型的張力的不同織機的斷裂。

##   wool tension breaks
## 1    A       L    401
## 2    A       M    216
## 3    A       H    221
## 4    B       L    254
## 5    B       M    259
## 6    B       H    169

然后我們使用xtabs(發音為交叉表)函數來生成列聯表:

##     tension
## wool   L   M   H
##    A 401 216 221
##    B 254 259 169

現在,df我們有了應用統計測試所需的結構。

統計檢驗

用於確定來自不同組的測量值是否獨立的兩種最常見的測試是卡方檢驗(χ2χ2測試)和費舍爾的精確測試。請注意,如果測量結果配對,則應使用McNemar測試(例如,可以識別單個織機)。

皮爾遜的卡方檢驗

該 χ2χ2test是一種非參數測試,可應用於具有各種維度的列聯表。測試的名稱源自χ2χ2分布,即獨立標准正態變量的平方分布。這是測試統計的分布χ2χ2 測試,由卡方值的總和定義 χ2我,jχ一世,Ĵ2 對於所有細胞對 我,j一世,Ĵ 由細胞觀察值之間的差異引起的 Ø我,jØ一世,Ĵ 和期望值 Ë我,jË一世,Ĵ,歸一化 Ë我,jË一世,Ĵ:

 

&Sigma; χ2我,j哪里χ2我,j= (O我,j- E.我,j)2Ë我,jΣχ一世,Ĵ2哪里χ一世,Ĵ2=(Ø一世,Ĵ- Ë一世,Ĵ)2Ë一世,Ĵ

 

這里的直覺是 &Sigma; χ2我,jΣχ一世,Ĵ2 如果觀測值明顯偏離預期值,則會很大 &Sigma; χ2我,jΣχ一世,Ĵ2如果觀測值與預期值很好地吻合,則接近於零。通過執行測試

## [1] 7.900708e-07

由於p值小於0.05,我們可以在5%顯着性水平上拒絕測試的零假設(斷裂的頻率獨立於羊毛)。根據df一個人的條目,然后可以聲稱羊毛B比羊毛A明顯更好(相對於經紗斷裂)。

調查Pearson殘差

另一種方法是考慮測試的卡方值。該chisq.test函數提供卡方值的Pearson殘差(根),即χ我,jχ一世,Ĵ。與由平方差異產生的卡方值相反,殘差不是平方的。因此,殘差反映了觀測值超過預期值(正值)或低於預期值(負值)的程度。在我們的數據集中,正值表示比預期更多的鏈斷裂,而負值表示更少的斷點:

##     tension
## wool          L          M          H
##    A  2.0990516 -2.8348433  0.4082867
##    B -2.3267672  3.1423813 -0.4525797

殘留物表明,與羊毛A相比,羊毛B的低張力和高張力斷裂比預期的要少。然而,對於中等張力,羊毛B比預期的斷裂更多。再次,我們發現,整體羊毛B優於羊毛A.殘留物的值也表明羊毛B對於低張力(殘差為2.1),高張力(0.41)和中等張力嚴重( - 2.8)。然而,殘留物有助於我們識別羊毛B的問題:它對中等張力的表現不佳。這將如何促進進一步發展?為了獲得在所有張力水平下表現良好的羊毛,我們需要專注於改善羊毛B的中等張力。為此,我們可以考慮使羊毛A在中等張力下表現更好的特性。

費舍爾的確切測試

Fisher的精確測試是用於測試獨立性的非參數測試,通常僅用於測試 2 × 22×2列聯表。作為精確顯着性檢驗,Fisher檢驗符合所有假設,在此基礎上定義檢驗統計量的分布。實際上,這意味着錯誤拒絕率等於測試的顯着性水平,對於近似測試,例如χ2χ2測試。簡而言之,Fisher的精確測試依賴於使用二項式系數根據超幾何分布計算p值,即通過

 

p = (n1 ,1+ n1 ,2ñ1 ,1)(n2 ,1+ n2 ,2ñ2 ,1)(n1 ,1+ n1 ,2+ n2 ,1+ n2 ,2ñ1 ,1+ n2 ,1)p=(ñ1,1+ñ1,2ñ1,1)(ñ2,1+ñ2,2ñ2,1)(ñ1,1+ñ1,2+ñ2,1+ñ2,2ñ1,1+ñ2,1)

 

由於計算的因子可能變得非常大,Fisher精確檢驗可能不適用於大樣本量。

請注意,無法指定測試的替代方法,df因為優勢比(表示效果大小)僅定義為2 × 22×2 矩陣:

 

O R = n1 ,1ñ1 ,2/ n2 ,1ñ2 ,2Ø[R=ñ1,1ñ1,2/ñ2,1ñ2,2

 

我們仍然可以執行Fisher精確檢驗以獲得p值:

## [1] 8.162421e-07

得到的p值類似於從中獲得的p值 χ2χ2 測試並得出相同的結論:我們可以拒絕零假設,即羊毛的類型與不同應力水平下觀察到的斷裂次數無關。

轉換為2乘2矩陣

為了指定備選假設並獲得優勢比,我們可以計算三者的測試 2 × 22×2可以構造的矩陣df

由於替代方案設置得更大,這意味着我們正在進行單尾測試,其中另一種假設是羊毛A與羊毛B的斷裂次數相關(即我們預期O R > 1Ø[R>1)。通過執行測試2 × 22×2表格,我們也獲得了解釋性:我們現在可以區分羊毛不同的具體條件。然而,在解釋p值之前,我們需要糾正多個假設檢驗。在這種情況下,我們進行了三次測試。在這里,我們只需將0.05的初始顯着性水平調整為0.053= 0.01 6¯¯¯0.053=0.016¯根據Bonferroni方法。根據調整后的閾值,以下測試顯着:

## [1] "L vs others"

這一發現表明,如果應力較輕,羊毛B僅顯着優於羊毛A. 請注意,我們也可以采用構建方法2 × 22×2 矩陣 χ2χ2測試。隨着χ2χ2 然而,測試並不是必要的,因為我們的分析基於殘差。

摘要:卡方對費舍爾的精確檢驗

以下是兩個測試的屬性摘要:

標准 卡方檢驗 費舍爾的確切測試
最小樣本量
准確性 近似 精確
列聯表 任意維度 通常為2x2
解釋 皮爾遜殘差 優勢比

通常,Fisher精確檢驗優於卡方檢驗,因為它是一種精確檢驗。如果單個細胞的觀察結果很少(例如小於10),則應特別避免卡方檢驗。由於Fisher的精確檢驗對於大樣本量和精確度可能在計算上是不可行的χ2χ2 測試隨着樣本數量的增加而增加 χ2χ2在這種情況下,測試是合適的替代品。另一個優點了χ2χ2 測試是它更適合維數超過的列聯表 2 × 22×2。

 

如果您有任何疑問,請在下面發表評論。 


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM