前言
我們做分析時經常要多人群分類,特別是做用戶畫像時經常用到,將對象划分為不同部分或者類別,在進一步分析,就能夠挖掘事物的本質
一、分類分析
根據指標的性質,分類分析法分為屬性指標分組和數量指標分組
1.屬性指標分組分析法
按屬性指標分組一般較簡單,分組指標一旦確定,組數、組名、組與組之間的界限也就確定。例如,人口按性別分為男、女兩組,具體到每一個人應該分在哪一組是一目了然的
2.數量指標分組分析法
數量指標分組分析法是指選擇數量指標作為分組依據,將數據總體划分為若干個性質不同的部分,分析數據的分布特征和內部聯系。根據數據的性質(離散數據或者連續數據),它分為單項式分組和組距式分組。
2.1單項式分組
單項式分組一般適用於離散型數據*,而且數據值不多、變動范圍較小的情況。每個指標值就是一個組,有多少個指標值就分成多少個組。如按產品產量、技術級別、員工工齡等指標分組。例如按照技術級別來分,有A、B、C三個組
2.2組距式分組
組距式分組,這是個是適用在連續數據上,指數據的變化幅度較大的條件下,將數據總體划分為若干個區間,每個區間作為一組,組內數據性質相同,組與組之間的性質相異。這里的組距式分組,也會分為兩種的,一個是等距分組,這種方法適用在連續數據分布相對均勻的;另一個是不等距分組,適用在連續數據分布不均勻的狀態。具體使用見下文:
a.等距分組:
第一步:確定維度、組數;
第二步:確定各組的組距;組距=(最大值-最小值)/組數;
第三步:根據組距,將數據划歸至對應組內
b.不等距分組
第一步:確定維度、組數;
第二步:根據需求確定各小組的上限與下限
第三步:依據小組上下限進行分組
第四步:評估分組后數據結構是否滿足需求
第五步:若滿足,則停止;若不滿足,則調整,從第一步循環
二、分組分析的應用
1.一維分類
定義一個維度(標准)將數據分析,常用一維分類
性別:男、女
年齡分段:青年、中年、老年
客戶價值:低價值、中價值、高價值
用戶狀態:沉默用戶、活躍用戶
一維分類常用柱形圖來做統計,比如下面的某小學各年級向災區的捐款情況
2.二維分類
數據按兩個維度分類時所列出的表,是由兩個的變量進行交叉分類的分布表,也稱為交叉分析。這里是常用表格來做展示,如下圖某產品12月用戶年齡與價值分布,從圖中能夠清楚看出青少年並且高價值的用戶分布最多,所以在后面做營銷策略的時候,可以做重點關注。
3.多維分類
但是有時一維和二維並不能滿足我們的需求,需要多維分類(和二維分類一樣都是稱為交叉分析)滿足需要。如下圖(Excel中的透視表):