下面要介紹多元方差分析的內容,多元方差分析是研究多個自變量與多個因變量相互關系的一種統計理論方法,又稱多變量分析。多元方差分析實質上是單因變量方差分析(包括單因素和多因素方差分析)的發展和推廣,適用於自變量同時對兩個或兩個以上的因變量產生影響的情況,用來分析自變量取不同水平時這些因變量的均值是否存在顯著性差異。
分析原理
多元方差分析可以看做是多因素方差分析和協方差分析合並后的拓展,能夠一次性做兩個以上因變量的多因素方差分析和協方差分析。多元方差分析的優點是可以在一次研究中同時檢驗具有多個水平的多個因素各自對多個因變量的影響以及各因素交互作用后對多個因變量的影響,以及多個因變量作為一個整體模型,自變量對模型的影響。
多元方差分析的條件是:各個自變量的每個水平必須是獨立的隨機樣本,服從正態分布且各總體方差相等。因變量和協變量必須是數值型變量且協變量與因變量相關。自變量可以是數值型分類變量,也可以是字符型分類變量,這是方差分析的基本條件。
案例分析
隨着經濟的發展,城市生活的節奏也是越來越快,白領的健康狀況成為了社會的熱門話題。人們晨練和早餐的狀況很能夠反映人們的生活習慣和健康狀況,所以有研究者對不同婚姻狀況、性別、年齡階段的人做了一次較大規模的隨機調查,獲得880個有效數據。現在用多元方差分析方法分析不同婚姻狀況、性別和年齡階段的人的晨煉狀況和早餐狀況是否有顯著性的差別。
(例題數據文件已經上傳到QQ群中,需要的朋友可以前往下載)
分析步驟
1、選擇菜單【分析】-【一般線性模型】-【多變量】,選擇“鍛煉情況”和“早餐狀況”作為因變量;再選擇“年齡”、“婚姻狀況”和“性別”作為自變量。本題中不涉及協變量,所以不用選擇協變量。按照下圖所示操作。
2、單擊【選項】按鈕,打開“多變量:選項”對話框,按下圖操作。
3、單擊【確定】,輸出分析結果。
結果解讀
1、協方差矩陣的齊性檢驗結果;
該檢驗的零假設是:因變量的協方差矩陣在各組中相等。從表可知,顯著性水平P值為0.000,小於0.05,則拒絕零假設,因變量的協方差矩陣在各個組中不相等,表明各個分組的均值不是完全相等的,說明有的變量對模型(兩個因變量整體)有顯著影響,有的自變量則對模型(兩個因變量模型)沒有影響。
2、多變量檢驗結果
因為協方差矩陣的齊性Box’s檢驗中顯著性概率P=0.000,小於0.05,拒絕方差齊性假設。因此要以“Pillai’s
3、誤差方差齊性檢驗
結果表明,晨練和首選早餐在各組中的方差齊性檢驗不成立,p=0.000,小於0.05。說明各個自變量和自變量交互對兩個因變量的獨立影響不完全一樣,有的顯著有的不顯著。
4、主體間效應的檢驗結果
從結果來看,年齡對晨練的效應顯著性為0.000,小於0.001,達到極顯著的水平,對於首選早餐的效應顯著性為0.036,小於0.05,也是顯著的。婚姻狀況對晨練的p=0.602,沒有達到顯著水平,即對因變量晨練沒有影響,但是對首選早餐的p=0.000,達到顯著水平,即對婚姻狀況首選早餐影響重大。在自變量交互里面,只有年齡*性別和年齡*性別*婚姻狀況對晨練有顯著性影響,其它的沒有顯著性影響。
綜上所述,年齡對於早餐選擇和晨練的影響都是顯著的,這也符合現在的生活節奏,年輕人能堅持晨練的少於老年人,同時,年輕人對於早餐的選擇也多是以方便快捷為主。婚姻狀況對晨練沒有影響,但是對早餐有影響,一般結婚后,家庭生活穩定,夫妻在一起吃早飯的情況較單身人士多。交互作用的體現比較容易理解,都是在有這兩個因素的影響下表現的數據指標顯著。數據分析培訓