一 用戶畫像簡介
• 用戶畫像,即用戶信息標簽化,通過收集用戶社會屬性、消費習慣、偏好特征等各個維度數據,進而對用戶或者產品特征屬性的刻畫,並對這些特征分析統計挖掘潛在價值信息,從而抽象出一個用戶的信息全貌;
• 可看做是企業應用大數據的根基,是定向廣告投放與個性化推薦的前置條件,為數據驅動運營奠定了基礎。如何從海量數據中挖掘出有價值的信息已經愈發重要。
二 用戶畫像的主要模塊
以用戶端的表單填寫、消費、瀏覽、搜索等相關操作行為數據作為輸入,通過數據建模、開發、產品化,幫助企業認知、了解用戶、客觀了解自己的產品,輸出到用戶端進而提供個性化的產品、服務和營銷方案做好一套能真正賦能於業務,產生落地價值的用戶畫像繞不開下面的8個主要模塊。
三 用戶畫像的標簽類型
用戶畫像建模其實就是對用戶進行打標簽,從對用戶打標簽的方式來看,一般分為三種類型:1、基於統計類的標簽;
2、基於規則類的標簽、
3、基於挖掘類的標簽。
下面我們介紹這三種類型標簽的區別:
1. 統計類標簽:
這類標簽是最為基礎也最為常見的標簽類型,例如對於某個用戶來說,他的性別、年齡、城市、星座、近7日活躍時長、近7日活躍天數、近7日活躍次數等字段可以從用戶注冊數據、用戶訪問、消費類數據中統計得出。該類標簽構成了用戶畫像的基礎;
2. 規則類標簽:
該類標簽基於用戶行為及確定的規則產生。例如對平台上“消費活躍”用戶這一口徑的定義為近30天交易次數>=2。在實際開發畫像的過程中,由於運營人員對業務更為熟悉、而數據人員對數據的結構、分布、特征更為熟悉,因此規則類標簽的規則確定由運營人員和數據人員共同協商確定;(同時需要借助數據調研)
3. 機器學習挖掘類標簽:
該類標簽通過數據挖掘產生,應用在對用戶的某些屬性或某些行為進行預測判斷。例如根據一個用戶的行為習慣判斷該用戶是男性還是女性,根據一個用戶的消費習慣判斷其對某商品的偏好程度。該類標簽需要通過算法挖掘產生。
在項目工程實踐中,一般統計類和規則類的標簽即可以滿足應用需求,開發中占有較大比例。機器學習挖掘類標簽多用於預測場景,如判斷用戶性別是男是女,判斷用戶購買商品偏好、判斷用戶流失意向等。一般地機器學習標簽開發周期較長,耗費開發成本較大,因此其開發所占比例較小。
四 畫像規划和數據架構——開發流程
第一階段:目標解讀
在建立用戶畫像前,首先需要明確用戶畫像服務於企業的對象,根據業務方需求,未來產品建設目標和用戶畫像分析之后預期效果;
第二階段:任務分解與需求調研
經過第一階段的需求調研和目標解讀,我們已經明確了用戶畫像的服務對象與應用場景,接下來需要針對服務對象的需求側重點,結合產品現有業務體系和“數據字典”規約實體和標簽之間的關聯關系,明確分析緯度;
第三階段:需求場景討論與明確
在本階段,數據運營人員需要根據前面與需求方的溝通結果,輸出《產品用戶畫像需求文檔》,在該文檔中明確畫像應用場景、最終開發出的標簽內容與應用方式 ,並就該份文檔與需求方反復溝通確認無誤。
第四階段:應用場景與數據口徑確認
經過第三個階段明確了需求場景與最終實現的標簽緯度、標簽類型后,數據運營人員需要結合業務與數據倉庫中已有的相關表,明確與各業務場景相關的數據口徑。在該階段中,數據運營方需要輸出《產品用戶畫像實施文檔》,該文檔需要明確應用場景、標簽開發的模型、涉及到的數據庫與表,應用實施流程;
第五階段:特征選取與模型數據落表
本階段中數據分析挖掘人員需要根據前面明確的需求場景進行業務建模,寫好HQL邏輯,將相應的模型邏輯寫入臨時表中,抽取數據校驗是否符合業務場景需求。
第六階段:線下模型數據驗收與測試
數據倉庫團隊的人員將相關數據落表后,設置定時調度任務,進行定期增量更新數據。數據運營人員需要驗收數倉加工的HQL邏輯是否符合需求,根據業務需求抽取查看表中數據范圍是否在合理范圍內,如果發現問題及時反饋給數據倉庫人員調整代碼邏輯和行為權重的數值。
第七階段:線上模型發布與效果追蹤
經過第六階段,數據通過驗收之后,就可以將數據接口給到搜索、或技術團隊部署上線了。上線后通過對用戶點擊轉化行為的持續追蹤,調整優化模型及相關權重配置。
五 畫像規划和數據架構——數倉架構
六 數據指標體系
需要開發的畫像標簽從大類上可划分為用戶人口屬性標簽、用戶行為標簽、風險控制維度標簽,進一步細分的話可在這兩個畫像基礎上開發出用戶偏好畫像和群體屬性、群體偏好畫像等。
6.1 屬性類標簽
屬性類指標按常見一級、二級標簽划分可以划分出很多,這里只給出一些示例…
6.2 行為類標簽
行為類指標按常見一級、二級標簽划分可以划分出很多,需根據具體業務決定,
用戶行為標簽畫像
用戶偏好畫像
用戶登錄活躍信息
6.3 風險控制類標簽
風控類指標按常見一級、二級標簽划分可以划分出很多
風險控制類標簽有多應用場景:
• 客服人員根據一些用戶是否高退貨、高投訴、高價值等特征標簽,采用不同的話術;
• 售后運營人員根據用戶是否高退貨、惡意刷單、連續拒簽收等標簽采用不同的運營措施