因子分析-對商戶進行綜合評價
雖然系統聚類分析可以對變量進行分類,但是,難以判斷變量分類結果的合理性。如果要衡量每個變量對類別的貢獻,也難以通過聚類分析來實現。因子分析,就是找出隱藏在變量背后具有共性的因子。
1.1 因子分析簡介
因子分析師通過研究變量間的相關系數矩陣,把這些變量間錯綜復雜的關系歸結成少數幾個綜合因子,並據此對變量進行分類的一種統計分析方法。由於歸結出的因子個數少於原始變量的個數,但是它們又包含原始變量的信息,這些因子之間的相關性較低,而因子內部的變量相關程度較高。所以,這一分析過程也稱為降維。
(1)因子載荷:就是原始變量和每個因子之間的相關系數,它反映了變量對因子的重要性。
(2)變量共同度:每個變量所包含的信息能夠被因子所解釋的程度,取值越大,說明該變量能被因子解釋的程度越高。
(3)因子選裝:對因子載荷矩陣進行旋轉,使原始變量和因子之間的關系更加突出,從而對因子的解釋更加容易。
(4)因子得分:因子得分可以用來評價每個個案在每個因子上的分值。
因子分析主要有四個步驟:
(1)判斷數據是否適合因子分析
(2)構造因子變量
(3)利用因子旋轉方法使得因子更具有實際意義
(4)計算每個個案因子的得分
2.因子分析實驗
使用SPSS進行因子分析,數據是某公司所屬的33個商戶O2O運營數據。通過分析它們在一段時間內的線上線下行為信息,以找出這些變量的共性,降低分析維度,並對商戶進行綜合評價。
實驗步驟:【分析】-【降維】-【因子】-【因子分析】
將“網點瀏覽量”、“論壇瀏覽量”、“線上廣告費用”、“地面推廣引入量”、“線下廣告費用”、“實體店鋪貨量”和“實體店訪客數”這七個變量移至【變量】框中,作為待分析變量。
圖 2
-1 【因子分析】參數設置
2-2 【因子分析:描述】對話框
勾選一個【KMO和巴特利特球形度檢驗】用於生成檢驗因子分析適合度的統計指標。
圖 2-3 【因子分析:提取】對話框
3.因子分析結果解讀
第一個輸出結果是“KMO和巴特利特檢驗”,如圖 3-1,該結果用來檢驗數據是否適合因子分析,主要參考KMO統計量即可。如圖,KMO統計量為0.627,介於0.5和0.7之間,說明該數據尚可進行因子分析。

圖 3-1 因子分析輸出結果:KMO和巴特利特檢驗
第二個輸出結果是“公因子方差”,也就是“變量共同度”,該結果顯示了原始變量能被提取的因子所表示的程度。如圖3-2 所有變量的共同度都在60%以上,可以認為多提取的因子對各變量的解釋能力是可以接受的。

圖3-2 因子分析:公因子方差
第三個輸出結果是“”總方差解釋,如圖 3-3。一般情況下,累積方差貢獻率達到60%及以上,則說明因子對變量的解釋能力尚可接受,達到80%及以上,說明因子對變量的解釋能力非常好。
圖3-3 因子分析輸出結果:總方差解釋
第四個結果是“碎石圖”,如圖 3-4 所示,該結果能夠輔助我們判斷最佳因子個數,通常是選取曲線中較陡的位置所對應的因子個數。

圖 3-4 因子分析輸出結果:碎石圖
從碎石圖中可以看出,前三個因子都在教陡的曲線上,所以提取2~3個因子都可以對原始變量的信息有較好的解釋。

圖 3-5 因子分析輸出結果:旋轉后的成分矩陣
通過需安裝后的椅子載荷矩陣,可以發現:
第一個因子,載荷較大的變量是“網店瀏覽量”、“論壇瀏覽量”、“線上廣告費用”和“實體店訪客數”,說明他們四個變量與該因子的相關程度較高,其中“網店瀏覽量”、“論壇瀏覽量”、“線上廣告費用”三個變量反映的是線上情況,而“實體店訪客數”變量雖然反映的是線下情況,但其載荷值符號為負號,顯然,該變量與第一個因子呈反向關系。
綜上所述,可將第一個因子命名為“線上商務”因子。
第二個因子,載荷較大的變量是“實體店鋪貨量”、“線下廣告費用”和“地面推廣引入量”,說明他們三個變量與該因子的相關程度較高,並且這些變量反映的是線下情況。
因此,可以將第二個因子命名為“線下商務”因子。
4.計算因子得分
由前面的計算可得,如圖 4-1 “FAC_1”和“FAC_2”這兩個變量是每個商戶在這兩個因子上的得分,柑橘這兩個變量旋轉載荷平方和的結果的因子貢獻率,加權計算,計算綜合得分。

圖 4-1 因子得分