1、用戶畫像的定義
用戶畫像,即用戶信息標簽化,
企業通過收集與分析消費者社會屬性、生活習慣、消費行為等主要信息的數據,抽象出一個用戶的商業全貌作是企業應用大數據技術的基本方式。
用戶畫像為企業提供了足夠的信息基礎,能夠幫助企業快速找到精准用戶群體以及用戶需求等更為廣泛的反饋信息。
2、為什么要給用戶畫像
打標簽是為了讓人能夠理解並且方便計算機處理,如:分類統計、數據挖掘。
分類統計:喜歡紅酒的用戶有多少?喜歡紅酒的人群中,男、女比例是多少?
數據挖掘:利用關聯規則計算,喜歡紅酒的人通常喜歡什么運動品牌?利用聚類算法分析,喜歡紅酒的人年齡段分布情況?
如:對某電商客戶,針對活動頁新訪客的應用中,依靠用戶畫像產生的個性化效果,對比熱銷榜,推薦效果有顯著提升:推薦欄點擊率提升28%, 訂單轉化率提升35%。
3、理解標簽
標簽提供了一種便捷的方式,方便計算機程序化處理與人相關的信息,甚至通過算法、模型能夠“理解” 人。
當計算機具備這樣的能力后,無論是搜索引擎、推薦引擎、廣告投放等各種應用領域,都將能進一步提升精准度,提高信息獲取的效率。
標簽通常是人為規定的高度精煉的特征標識,如年齡段標簽:25~35歲,地域標簽:北京,
標簽呈現出兩個重要特征:語義化(好理解)和短文本(不可拆分)
【語義化】人能很方便地理解每個標簽含義。能夠較好的滿足業務需求。如,判斷用戶偏好。
【短文本】每個標簽通常只表示一種含義,標簽本身無需再做過多文本分析等預處理工作,為利用機器提取標准化信息提供了便利。
4、用戶畫像的目標
用戶畫像的目標是通過分析用戶行為,最終為每個用戶打上標簽,以及該標簽的權重。如,紅酒 0.8、李寧 0.6。
標簽,表明用戶對該內容有興趣、偏好、需求等等。
權重,表明用戶的興趣、偏好指數,也可能表征用戶的需求度,可以簡單的理解為可信度,概率。
5、用戶畫像的方法