用戶分層和用戶分群是經常在工作中被提到的兩個詞,有的場景下這兩個詞的可以理解為同一含義,不過嚴謹來說:
- “分層”有順序或者嵌套的關系;
- “分群”則更多是“分類”的含義,類似於MECE的平級並列關系;
為了方便討論,本文主要以“用戶分群”的概念來進行討論。
可以從兩個角度來看“用戶分群”:
- 技術角度,從數據上來看是怎么做的;
- 業務角度,即業務上對用戶進行划分方法;
技術角度下的用戶分群
主要有如下3類方法:
- 單維度的組別划分;
- 多維度的組合,再划分組別;
- 使用聚類算法來得到分組;
單維度的組別划分
用戶的一系列屬性值可以看做一個個變量。變量取值可能存在兩種情況:
離散值
,常見的是是否標記(e.g. 是否為付費用戶)、類別歸屬(e.g. 收貨所在省、支付狀態)、等級順序(e.g.會員等級);連續值
,常見的有時間(e.g. 注冊時長、使用時長)、金錢(e.g.交易金額)、頻次(e.g.訂單數量),連續值可以進行二值化或者分箱得到組別划分,比如考試成績設定分數線來判定合格或不合格;
多維度的類別組合
多維度下的分組是可以通過多個已經分類的維度進行排列組合得到。
e.g. 兩個維度進行組合得到的BCG/GE矩陣
e.g. 3個維度進行組合得到的RFM模型。
多標簽分類,e.g.如果患者出現了如下ABCD症狀,那么可能是疾病X,如果是CDEF症狀,那么可能是疾病Y
聚類算法得到的分類
前兩者更依賴於先驗的業務知識來進行划分,聚類算法則是從底層數據發現規律,可能會得到業務上可能不能解釋但是卻能帶來業務價值的分組。
從技術上講,聚類算法也是多個維度的數據衍生出一個新的分類字段,但是不同於多維度的組別划分那樣,所使用的多個維度本來就是分組的,只是對分組進行組合即可。而聚類算法對於所使用的原始的多個變量並不在乎其取值是連續還是離散的,最終輸出的是離散的類別就行。
業務角度下的用戶分群
主要方法如下:
- 用戶屬性,e.g. 用戶在產品中扮演的角色、用戶的產品屬性、社會屬性等
- 用戶價值,通常和用戶能帶給產品的收入有關,最簡單的划分就是免費玩家和人民幣玩家,28法則或者金字塔法則是用戶價值的划分的兩個常用規則;
- 用戶行為,用戶對產品的認知、選擇產品的決策過程、用戶從新手到忠誠發生的變化等都可以從用戶的行為上得到洞察;
- 生命周期,這個生命周期是相對於用戶在產品中的經歷而言,從不知道某個產品->初次使用->建立信任->成為忠誠用戶->流失,這個過程中體現了用戶認知的變化,還涉及用戶的決策過程的循序漸進以及用戶需求的衰退或者轉移;
用戶屬性
用戶屬性可以大致分為兩類:
依托於產品的屬性
,也就是這個屬性只是針對當前的產品或者平台而定義,e.g. 用戶的角色,會員層級,是否開通或使用某產品服務;獨立於產品的屬性
,用戶作為自然人具有的屬性,e.g. 性別、年齡、所在地、職業、收入等;
依托於產品的屬性,用戶在產品中的
- 角色(role) ,e.g. 授課平台上的講師、學生;打車平台上的司機、乘客;電商平台上的賣家、賣家;外賣平台上的商鋪、訂餐用戶、送餐員;
- 狀態(status) ,一般是從初始(默認)狀態發生變化,狀態相對穩定且有些條件下不可逆,比如對特定行為的標記,e.g.是否付費、是否購買了某服務、是否使用了某功能、是否開通會員等;
- 類型(type) ,e.g.登陸設備類型、操作系統類型、登陸賬號類型、會員類型等;
- 標記(stamp) ,比如注冊標記(日期、來源的渠道、活動等),“首次”標記(首單日期、金額),“上次”標記,“最”大(小)標記等;
獨立與產品的屬性,這些用戶屬性不以產品的不同而轉移;
- 作為“自然”人,具有種族、性別、年齡、婚育、所在地等特征;
- 作為“社會”人,則和用戶在社會生活中扮演的角色有關,e.g.教育(專業、學歷等)、職業(行業、職位、收入、工作年限等)、家庭(人口、資產、住房等)、興趣愛好等;
用戶行為
對於用戶的行為,需要關注如下方面:
- 有業務價值的行為,包括有直接價值(帶來收入)的行為(頁面瀏覽、付費交易等),也包括有潛在價值的行為,e.g. 注冊、登陸、瀏覽、發表、點贊、評論、轉發等,作為“輔助”,這些行為不一定能直接帶來收入,但是可能拼成“藏寶圖”,通過對這些行為的分析能發現潛在價值高、成長空間大的用戶。另外,需要注意的是,不同的業務形態,關注的用戶行為是有較大差異的。
- 用戶行為的質量,比如那些行為指標數值越大越好(e.g.頁面訪問深度、停留時長、轉化率等),或者反之越小越好的(e.g.頁面跳出、訪問時間間隔),此外,在某些業務場景下,用戶有較好的行為周期也是行為質量高的表現,e.g.每天訪問app,每隔一段時間就到平台上來買米面糧油等;
- 用戶行為的偏好,這里是指業務上的行為,用戶可以在產品定義的范圍內執行的行為可以看做一個集合,每個特定的行為相當於其中的元素,不同用戶的行為偏好會有差異e.g. 讀到好文章,有的用戶傾向“點贊”,有的用戶則是“收藏”或“轉發”;
- 行為對象的偏好,“行為對象”就是用戶行為的指向物,比如購買的商品(包括商品的品類、品牌、價格、優惠等)、瀏覽的內容(包括類型、風格、作者、排版等),e.g. 我買書的時候基本只看當當或京東,日用百貨就去京東,購買服飾類就去唯品會;e.g. 大家都在同一平台上看視頻,有的用戶主要看電影、有的是看動漫,其他一些用戶則是來追電視劇;
- 用戶行為的變化,e.g. 曾經買買買,如今則只逛不買,用戶行為的變化和業務指標的波動高度關聯,指標波動歸因是數據分析任務中的常見場景,所以做好對用戶行為變化的監控,是非常基礎的工作。用戶行為的變化分可以按空間和時間上去划分:
- 空間上關注具體的用戶群以及業務場景;
- 時間上則關注用戶群體行為變化的時間點,看是“臨時突變”,還是“持續變化”;
- 行為背后的認知,可能除了用戶調研、產品反饋、客服投訴這3類渠道外,用戶很難親口說出自己的需求,大部分時候需要從用戶的行為數據中去揭示更深層的用戶認知。e.g. 品牌忠誠、價格敏感、容易投訴、沖動消費。
用戶價值
用戶價值的高低和用戶屬性以及用戶行為都有高度的關聯,所以對用戶的價值的評估可以看做是多個維度的綜合指標。
用戶價值的考量基礎是這個用戶能為平台帶來多大收益(潛在收益),換句話說我們能通過這個用戶獲得多少收入。
對於用戶帶來的收入而言包含以下含義:
- 對於每個用戶而言,從對方進入平台到流失這個過程獲得收入的期望值是多少,這個值也就是用戶生命周期價值(Customer Lifetime Value, CLV);
- 考量用戶價值時,除了其潛在的收入有多少外,還會考慮獲得收入的可能性,也就是“從哪些用戶那里更容易獲得收入(或者獲得收入的概率更高)”;
- 通過用戶獲得的收入不一定是用戶付費,要看具體的商業模式,對於很大一部分產品而言,廣告才是收入的大頭,除了向用戶兜售商品、服務或功能外,用戶的注意力也可以被賣錢;
生命周期
用戶的生命周期是理論上的一個從新客到老客再到過客的完整流程。
用戶生命周期的划分需要注意的是:
- 處於不同生命周期在用戶行為上會有什么表現?可以參考前文從個人經歷談用戶生命周期
- 生命周期在不同的用戶身上表現是有差異的,有的用戶在平台待的時間可能很長,有的就比較短,有的用戶並沒有經歷完整的生命周期就流失掉了。
其他補充
如何選擇維度?
- 首先要看你要解決的問題是什么?或者你的業務目標是什么?
- 選擇的維度要喝業務目標高度關聯;
- 維度不一定要很多,達到一定的效度就可以,太復雜反而不利於操作;
分群的注意事項
- 厘清分群的目的
- 可以是簡單地對用戶特征進行描述,以便於了解用戶;
- 可以是對用戶的價值判斷然后分群排序(分層),便於資源的傾斜和分配,e.g.有人吐槽“RFM模型”沒啥價值,這個模型用來確定群體優先級還是很好用的,此外,如果跨時間周期對比RFM矩陣中的變化,也可以檢查業務是否健康;
- 也可以是基於產品、運營活動的前提,要對不同的用戶群進行不同的操作,那么分群應該能指明操作的方向,比如促銷選擇那些人群?如何配置優惠力度?選擇哪些商品?等等
- 既然是分組,就要保證組間的差異足夠顯著,這個涉及到分組的規則,要看具體業務場景。