什么是用戶畫像?具體公司體現在哪?什么作用呢?


 
什么是用戶畫像?

簡而言之,用戶畫像是根據用戶社會屬性、生活習慣和消費行為等信息而抽象出的一個標簽化的用戶模型。構建用戶畫像的核心工作即是給用戶貼“標簽”,而標簽是通過對用戶信息分析而來的高度精煉的特征標識。

舉例來說,如果你經常購買一些玩偶玩具,那么電商網站即可根據玩具購買的情況替你打上標簽“有孩子”,甚至還可以判斷出你孩子大概的年齡,貼上“有5-10歲的孩子”這樣更為具體的標簽,而這些所有給你貼的標簽統在一次,就成了你的用戶畫像,因此,也可以說用戶畫像就是判斷一個人是什么樣的人。

除去“標簽化”,用戶畫像還具有的特點是“低交叉率”,當兩組畫像除了權重較小的標簽外其余標簽幾乎一致,那就可以將二者合並,弱化低權重標簽的差異。

用戶畫像的作用

羅振宇在《時間的朋友》跨年演講上舉了這樣一個例子:當一個壞商家掌握了你的購買數據,他就可以根據你平常購買商品的偏好來決定是給你發正品還是假貨以提高利潤。且不說是否存在這情況,但這也說明了利用用戶畫像可以做到“精准銷售”,當然了,這是極其錯誤的用法。

其作用大體不離以下幾個方面:

  1. 精准營銷,分析產品潛在用戶,針對特定群體利用短信郵件等方式進行營銷;
  2. 用戶統計,比如中國大學購買書籍人數 TOP10,全國分城市奶爸指數;
  3. 數據挖掘,構建智能推薦系統,利用關聯規則計算,喜歡紅酒的人通常喜歡什么運動品牌,利用聚類算法分析,喜歡紅酒的人年齡段分布情況;
  4. 進行效果評估,完善產品運營,提升服務質量,其實這也就相當於市場調研、用戶調研,迅速下定位服務群體,提供高水平的服務;
  5. 對服務或產品進行私人定制,即個性化的服務某類群體甚至每一位用戶(個人認為這是目前的發展趨勢,未來的消費主流)。比如,某公司想推出一款面向5-10歲兒童的玩具,通過用戶畫像進行分析,發現形象=“喜羊羊”、價格區間=“中等”的偏好比重最大,那么就給新產品提供類非常客觀有效的決策依據。
  6. 業務經營分析以及競爭分析,影響企業發展戰略
構建流程
數據收集

數據收集大致分為網絡行為數據、服務內行為數據、用戶內容偏好數據、用戶交易數據這四類。

  • 網絡行為數據:活躍人數、頁面瀏覽量、訪問時長、激活率、外部觸點、社交數據等
  • 服務內行為數據:瀏覽路徑、頁面停留時間、訪問深度、唯一頁面瀏覽次數等
  • 用戶內容便好數據:瀏覽/收藏內容、評論內容、互動內容、生活形態偏好、品牌偏好等
  • 用戶交易數據(交易類服務):貢獻率、客單價、連帶率、回頭率、流失率等
    當然,收集到的數據不會是100%准確的,都具有不確定性,這就需要在后面的階段中建模來再判斷,比如某用戶在性別一欄填的男,但通過其行為偏好可判斷其性別為“女”的概率為80%。

還得一提的是,儲存用戶行為數據時最好同時儲存下發生該行為的場景,以便更好地進行數據分析。

行為建模

該階段是對上階段收集到數據的處理,進行行為建模,以抽象出用戶的標簽,這個階段注重的應是大概率事件,通過數學算法模型盡可能地排除用戶的偶然行為。

這時也要用到機器學習,對用戶的行為、偏好進行猜測,好比一個 y=kx+b 的算法,X 代表已知信息,Y 是用戶偏好,通過不斷的精確k和b來精確Y。

在這個階段,需要用到很多模型來給用戶貼標簽。

  • 用戶汽車模型
    根據用戶對“汽車”話題的關注或購買相關產品的情況來判斷用戶是否有車、是否准備買車
  • 用戶忠誠度模型
    通過判斷+聚類算法判斷用戶的忠誠度
  • 身高體型模型
    根據用戶購買服裝鞋帽等用品判斷
  • 文藝青年模型
    根據用戶發言、評論等行為判斷用戶是否為文藝青年
  • 用戶價值模型
    判斷用戶對於網站的價值,對於提高用戶留存率非常有用(電商網站一般使用RFM 實現)
    還有消費能力、違約概率、流失概率等等諸多模型。
用戶畫像基本成型

該階段可以說是二階段的一個深入,要把用戶的基本屬性(年齡、性別、地域)、購買能力、行為特征、興趣愛好、心理特征、社交網絡大致地標簽化。

為什么說是基本成型?因為用戶畫像永遠也無法100%地描述一個人,只能做到不斷地去逼近一個人,因此,用戶畫像既應根據變化的基礎數據不斷修正,又要根據已知數據來抽象出新的標簽使用戶畫像越來越立體。

關於“標簽化”,一般采用多級標簽、多級分類,比如第一級標簽是基本信息(姓名、性別),第二級是消費習慣、用戶行為;第一級分類有人口屬性,人口屬性又有基本信息、地理位置等二級分類,地理位置又分工作地址和家庭地址的三級分類。

數據可視化分析

這是把用戶畫像真正利用起來的一步,在此步驟中一般是針對群體的分析,比如可以根據用戶價值來細分出核心用戶、評估某一群體的潛在價值空間,以作出針對性的運營。
如圖:


后記

這里只寫了用戶畫像的構建流程和一些原理,下次有時間我會寫篇關於大數據平台的實踐文章,並說一下一些行為模型的算法原理,有興趣的朋友可以關注我的博客

參考閱讀:
[1]永洪BI:手把手教您搞定用戶畫像
[2]易觀智庫:大數據下的用戶分析(PPT)
[3]楊步濤:基於用戶畫像的大數據挖掘實踐
[4]慕課網:電商大數據應用之用戶畫像
[5]知乎:Alex Chu 關於用戶畫像的回答

作者:Tristan
鏈接:https://www.zhihu.com/question/19853605/answer/105450827
來源:知乎
著作權歸作者所有。商業轉載請聯系作者獲得授權,非商業轉載請注明出處。

作為阿里廣告部門的數據分析師,我目前工作中涉及到的數據分析主要可以分為:行業研究、產品/業務數據支持以及人群洞察(用戶畫像)。今天就和大家分享下我在用戶畫像數據分析中一些心得體會。


什么是用戶畫像:

用戶畫像,又稱人群畫像,是根據用戶人口統計學信息、社交關系、偏好習慣和消費行為等信息而抽象出來的標簽化畫像。構建用戶畫像的核心工作即是給用戶貼“標簽”,而標簽中部分是根據用戶的行為數據直接得到,部分是通過一系列算法或規則挖掘得到。直接得到的數據比較好理解,比如用戶在網站或APP上主動填寫和上傳的數據,嚴格一些平台(比如電商平台)會要求用戶上傳身份證、學生證、駕駛證、銀行卡等,這樣的數據准確性就較高,因此毫無疑問阿里和騰訊在用戶基礎數據的准確性上甩百度幾條街。通過算法和數據挖掘得到的標簽可以這么理解:如果一個用戶最近開始購買母嬰類商品(比如一段的奶粉,New Baby的紙尿布),那么可以根據用戶購買的頻次及數量,結合用戶的年齡、性別推斷是否為新媽媽/爸爸。

BAT用戶畫像數據淺析:

百度:

百度數據類型廣泛,主要包含搜索數據、百度知道、百度貼吧及百度地圖等數據,但是這些數據很少可以精確到個體用戶層面,搜索大數據可以預測流行病爆發時間、世界杯的勝負概率及城市擁堵狀況,總之百度的數據在宏觀層面有不少應用,但是在微觀的用戶畫像層面,百度毫無優勢,大部分人還沒有百度賬號呢,百度的用戶體系最近幾年也是靠一些APP慢慢完善起來的。

騰訊:

騰訊的數據優勢在社交數據,此外隨着微信/QQ支付的普及,騰訊也有了用戶身份證、銀行卡等數據。騰訊的數據積累年限久遠、維度豐富,從QQ、Qzone、騰訊微博到微信,騰訊涵蓋興趣偏好、地理位置、人口統計學信息等等數據,且准確性也不低。

騰訊在用戶畫像數據方面有很廣泛的維度,且在興趣、心理特征等標簽上有很高的准確性。

阿里:

據統計,2015年阿里巴巴活躍用戶數為4.07億,覆蓋98.5%的中國互聯網購物人群。其中,移動月度活躍用戶達到3.93億,占整個中國手機網民的64%,這意味着六成以上的中國手機網民都是淘寶或天貓移動端的活躍用戶。(以上相關數據摘自“阿里媽媽電商營銷”微信公眾號)

目前阿里的數據標簽已經逐步整理到阿里的數據超市——GProfile全局檔案。GProfile 全局檔案是以消費者檔案為核心構建內容,通過分析消費者的基礎信息、購物行為以描繪其特征畫像。在阿里數據的平台上,GProfile 主要根據用戶在歷史時間內的網購行為記錄,從網購時間點、內容深度剖析,提供用戶基礎屬性、社交行為、互動行為、消費行為、偏好習慣、財富屬性、信用屬性和地理屬性八大類標簽服務。此外,從數據能力來說,阿里的數據還可結合優酷土豆視頻數據、CNZZ友盟媒體數據、蝦米天天動聽音樂數據等。(以上相關內容摘自“阿里數據”微信公眾號)

阿里數據的特點是真實、可靠,隨着公司收購其他數據類平台,阿里的數據類型也逐漸豐富起來,在用戶畫像數據方面,阿里可謂徹徹底底的真人數據。

(以上對百度和騰訊數據的分析會有不少推斷和猜測,不妥之處,歡迎指正。)


用戶畫像的價值:

1:精准營銷。精准營銷是用戶畫像或者標簽最直接和有價值的應用。這部分也是我們廣告部門最注重的工作內容。當我們給各個用戶打上各種“標簽”之后,廣告主(店鋪、商家)就可以通過我們的標簽圈定他們想要觸達的用戶,進行精准的廣告投放。無論是阿里、還是騰訊很大一部分廣告都是通過這種方式來觸達用戶,百度的搜索廣告方式有所不同。

2:助力產品。一個產品想要得到廣泛的應用,受眾分析必不可少。產品經理需要懂用戶,除了需要知道用戶與產品交互時點擊率、跳失率、停留時間等行為之外,用戶畫像能幫助產品經理透過用戶行為表象看到用戶深層的動機與心理。

3:行業報告與用戶研究。通過對用戶畫像的分析可以了解行業動態,比如90后人群的消費偏好趨勢分析、高端用戶青睞品牌分析、不同地域品類消費差異分析等等。這些行業的洞察可以指導平台更好的運營、把握大方向,也能給相關公司(中小企業、店鋪、媒體等)提供細分領域的深入洞察。


感想:

用戶畫像是對人的深入挖掘,除了基本的人口統計學信息、地理位置、設備資產等客觀屬性之外,如興趣偏好等是自由度很大的標簽,在很多應用題場景,廣告主(或需求方)更需要用戶興趣、價值觀、人格層面的標簽。比如汽車客戶,環保類的電動車品牌想要觸達的是有環保意識、喜歡小排量的用戶,這就涉及到人的價值觀層面了,因此制作這些標簽的時候不能僅僅通過用戶行為直接產生,需要更深入人格的建模。隨着互聯網野蠻生長時代的消退以及數據技術的進一步提升,從人心理、人格層面的深度分析將逐漸得到重視和應用。我十分期待阿里能構建一套基於人格心理學的標簽,這必將給淘寶帶來更好的用戶體驗,增加我這種不喜歡花哨頁面用戶的停留時間。


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM