1、聯合概率,邊際概率,條件概率的概念:
聯合概率:個體落入第(i,j)個格子的概率
邊際概率:行/列聯合概率之和
條件概率:在給定解釋變量取值的情況下,結果變量的概率分布
某離散分布:
2、聯合概率、邊際概率、條件概率的關系:
其中,
Pr(X=x, Y=y)為“XY的聯合概率”;
Pr(X=x)為“X的邊際概率”;
Pr(X=x | Y=y)為“X基於Y的條件概率”;
Pr(Y=y)為“Y的邊際概率”;
從上式子中可以看到:
Pr(X=x, Y=y) = Pr(X=x | Y=y) * Pr(Y=y)
即:“XY的聯合概率”=“X基於Y的條件概率”乘以“Y的邊際概率”
這個就是聯合概率、邊際概率、條件概率之間的轉換計算公式。
前面表述的是離散分布,對於連續分布,也差不多。
只需要將“累加”換成“積分”。
3、列聯表中的統計獨立
1)當行變量是解釋變量,列變量是結果變量時,兩者獨立,意味着:
①解釋變量不同水平下的結果變量的條件概率應該相等
②結果變量的每一個條件分布與它的邊際分布相同
③因此,這種情況又叫“同質分布”Homogeneous Distribution
如,在上圖中,如吃不吃維生素C與是否感冒兩者獨立時,有A = B = C, D = E = F,其中A B C D E F均為概率。
2)當行變量和列變量都是結果變量時,兩者獨立意味着:XY的聯合概率等於X和Y的邊際概率的乘積
4、列聯表分析中的獨立性檢驗步驟--卡方檢驗
https://blog.csdn.net/u013164612/article/details/80715769
轉自:https://blog.csdn.net/libing_zeng/article/details/74625849