1、數據檢驗。由於問卷、量表的題目是主觀判斷和選擇,因而難免有些人不認真填,所以,篩選出有效、高質量的數據非常關鍵。通常需要作如下檢查:(1)是否有人回答互相矛盾,比如A1與A2不應該都同意,結果卻都同意了;在學業情緒問卷中體現為積極體驗和消極體驗的題目得分應該互斥,不應該具有相同體驗;(2)是否有人沒有明顯態度偏向,例如大多數題目都選了完全同意或完全不同意或中立;(3)是否有人應答率太低,例如在很多題目上都沒有填寫;(4)是否有人故意回答出有規律的題目,例如23354-54332-23354,重復有規律的作答;(5)數據錄入是否有重復、躥題、超出題目取值范圍等。
2、反向計分與維度得分計算。確認量表是否有反向計分題,如果有要反向計分,注意,不要在數據錄入時就反向,應該是原樣錄入數據然后在SPSS中做反向處理。其次,維度分的計算要注意使用的是題目加和得分還是題目均值得分。雖然在相關、差異和回歸分析中,維度分使用總分或均分,其結論都是一樣的,但是為了和其他研究保持一致,便於研究對比,量表必須用原編制者所采用的計分方法。由於學業情緒問卷題目很多,維度也很多,因此建議采用SPSS的Syntax來計算維度分,這樣方便核對和重復計算。此外,小因子分和大維度分都應該計算,以備各種可能分析。
3、人口學變量的處理。人口學變量(性別、年齡、年級、家庭所在地等)通常是用於做t檢驗、方差分析等均值差異分析,也可以間接的說明人口學變量與量表維度得分之間的相關性。在這一環節中,人口學變量的分組或分類非常重要,為了保證結果的可靠性,每個分組水平下的樣本量應該大於30或接近30,如果不是,那就要考慮與臨近水平組合並或者排除這一類別。此外,單因素方差分析中,分組數目建議不超過四組。
4、數據極端值與缺失值的處理。數據存在極端值的話,會嚴重影響人口學變量差異分析、相關性分析以及回歸分析的結果,因而要識別極端值將其剔除。其次,缺失值如果較少,建議用均值替換掉,以便在結構方程模型中方便應用。
5、在數據分析環節,一般包括各個量表維度和總分的描述性統計、人口學變量差異分析(t檢驗與方差分析,深入一點的還需要使用多元方差分析)、相關系數分析、回歸分析,這些都是SPSS可以做的。更復雜的分析內容包括中介效應、調節效應分析,可以用SPSS的Process來處理中介和調節作用。尤其是中介作用分析,不建議用Baron、kenney的三步法來做,這個方法不規范、結果不可靠甚至會導致結果出錯。由於學業情緒問卷的因子太多,我們可以考慮只分析幾個大維度的得分,或者用Amos等結構方程模型軟件構建潛變量模型。