1、和目標有關的用戶數據
構建用戶畫像是為了還原用戶信息,因此數據來源於:所有用戶相關的數據。
對於用戶相關數據的分類,使用【封閉性的分類方式】。
如,世界上分為兩種人,一種是學英語的人,一種是不學英語的人;
用戶分三類,高價值用戶,中價值用戶,低價值用戶;
產品生命周期分為,投入期、成長期、成熟期、衰退期…
這樣的分類方式,有助於后續不斷枚舉並迭代補充遺漏的信息維度。
另外,不同的分類方式根據應用場景,業務需求的不同,也許各有道理,按需划分即可。
用戶數據可以划分為靜態信息數據、動態信息數據兩大類。
3、靜態信息數據
用戶相對穩定的信息,這類信息自成標簽。
如:人口屬性、商業屬性等方面數據。
如果企業有這類信息則無需過多建模預測,更多的是數據清洗工作。
4、動態信息數據
用戶不斷變化的行為信息,即用戶軌跡。
當行為集中到互聯網,乃至電商,用戶行為就會聚焦很多,
如:瀏覽凡客首頁、瀏覽休閑鞋單品頁、搜索帆布鞋、發表關於鞋品質的微博、贊“雙十一大促給力”的微博消息。
等等均可看作互聯網用戶行為。