數據分析-分類分析


前言

我們做分析時經常要多人群分類,特別是做用戶畫像時經常用到,將對象划分為不同部分或者類別,在進一步分析,就能夠挖掘事物的本質

一、分類分析

根據指標的性質,分類分析法分為屬性指標分組數量指標分組

1.屬性指標分組分析法

按屬性指標分組一般較簡單,分組指標一旦確定,組數、組名、組與組之間的界限也就確定。例如,人口按性別分為男、女兩組,具體到每一個人應該分在哪一組是一目了然的

2.數量指標分組分析法

數量指標分組分析法是指選擇數量指標作為分組依據,將數據總體划分為若干個性質不同的部分,分析數據的分布特征和內部聯系。根據數據的性質(離散數據或者連續數據),它分為單項式分組和組距式分組。

2.1單項式分組

單項式分組一般適用於離散型數據*,而且數據值不多、變動范圍較小的情況。每個指標值就是一個組,有多少個指標值就分成多少個組。如按產品產量、技術級別、員工工齡等指標分組。例如按照技術級別來分,有A、B、C三個組

2.2組距式分組

組距式分組,這是個是適用在連續數據上,指數據的變化幅度較大的條件下,將數據總體划分為若干個區間,每個區間作為一組,組內數據性質相同,組與組之間的性質相異。這里的組距式分組,也會分為兩種的,一個是等距分組,這種方法適用在連續數據分布相對均勻的;另一個是不等距分組,適用在連續數據分布不均勻的狀態。具體使用見下文:

a.等距分組:
第一步:確定維度、組數;
第二步:確定各組的組距;組距=(最大值-最小值)/組數;
第三步:根據組距,將數據划歸至對應組內

b.不等距分組
第一步:確定維度、組數;
第二步:根據需求確定各小組的上限與下限
第三步:依據小組上下限進行分組
第四步:評估分組后數據結構是否滿足需求
第五步:若滿足,則停止;若不滿足,則調整,從第一步循環

二、分組分析的應用

1.一維分類

定義一個維度(標准)將數據分析,常用一維分類
性別:男、女
年齡分段:青年、中年、老年
客戶價值:低價值、中價值、高價值
用戶狀態:沉默用戶、活躍用戶
一維分類常用柱形圖來做統計,比如下面的某小學各年級向災區的捐款情況

 

 2.二維分類

數據按兩個維度分類時所列出的表,是由兩個的變量進行交叉分類的分布表,也稱為交叉分析。這里是常用表格來做展示,如下圖某產品12月用戶年齡與價值分布,從圖中能夠清楚看出青少年並且高價值的用戶分布最多,所以在后面做營銷策略的時候,可以做重點關注。

 

3.多維分類

但是有時一維和二維並不能滿足我們的需求,需要多維分類(和二維分類一樣都是稱為交叉分析)滿足需要。如下圖(Excel中的透視表):

 


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM