概述:
在數據越來越值錢的年代,用戶畫像和標簽也被熱議了許久。無論你身處IT部門還是業務部門,一定都聽說過用戶畫像或者標簽,甚至有不少人基於此開展各項日常工作。
1. 標簽
對某一類特定群體或對象的 某項特征進行的抽象分類和概括,其值(標簽值)具備可分類性。
例如:
- 對於“人”這類群體,可將“男”、“女”這類特征進行抽象概括,統稱為“性別”,“性別”即一個標簽;
- 對於“手機”這類對象,可將“高通”、“海思” 這類特征進行抽象概括,統稱為“手機處理器”,“手機處理器”即一個標簽。
2.標簽系統
標簽和用戶畫像的整合應用中心,通常由標簽、標簽樹、畫像中心構成。
3.用戶畫像
由某一特定群體或對象的多項特征構成,輸出結果通常是對特征的具體描述。(也可理解為用戶畫像是由多個標簽組合而成,其實例是由多個標簽值構成)。
用戶畫像 = 自我介紹
例如:
1.小明是用戶畫像的一個實例, 小明的輸出結果為“男“、“20”、“iPhone”、“北京”、“足球”,是由多個標簽中的具體標簽值構成。
2.我的一個好友叫王小震,25歲,摩羯座,從事軟件開發工作,超級無敵工作狂,平時喜歡外出爬山,打球、喜歡看書,類型多偏技術和管理,偶爾玩玩LOL等游戲,喜歡美食,但對海鮮過敏,目前還是單身狗一只……
#看完之后,是不是感到這個人物十分清晰了?這是因為一個完整的人物畫像已經呈現在了你的腦海里。當標簽被描述得越多,你的用戶畫像就越清晰。
#理論上來說,先要有標簽才能組件用戶畫像
4.做用戶畫像的意義
a.從公司戰略層面來說,好的用戶畫像可以幫助企業進行市場洞察、預估市場規模,從而輔助制定階段性目標,指導重大決策,提升ROI;更有助於避免同質化,進行個性化營銷。
b.從產品本身角度來說,用戶畫像可以圍繞產品進行人群細分,確定產品的核心人群,從而有助於確定產品定位,優化產品的功能點。例如美妝類app,則前期可大致鎖定畫像一二線城市,喜歡時尚,年齡段在18至35之間的女性。
c.從數據管理角度來說,用戶畫像有助於建立數據資產,挖掘數據的價值,使數據分析更為精確,甚至可以進行數據交易,促進數據流通。互聯網營銷行業中常用的DMP(Data Management Platform)就是用戶畫像使用的一個好例子。
5.用戶畫像的基本要素
用戶畫像主要從靜態屬性、動態屬性、消費屬性和心理屬性來划分。
靜態屬性是勾勒用戶畫像的基礎:性別、年齡、學歷、角色、收入、地域、婚姻等。
動態屬性是指用戶在互聯網上的上網行為、娛樂偏好、社交習慣、出行方式以及獲取知識的方式,這些都直接反應了用戶對你的內容是否感興趣。
消費屬性是指用戶的消費水平、消費心理、消費嗜好等,這反映的是用戶對花錢有什么看法。到底是喜歡質量好的還是追求品質高的呢?到底是傾向於功能價值還是情感價值?
心理屬性是指用戶在生活、工作、情感、社交等方面所擁有的個人價值觀。
6.構建用戶畫像的步驟
采集數據:數據的來源有多種,很多公司有自己的CRM系統,或者有智能采集系統日志的工具,常用的采集方式包括API、SDK和傳感器采集等,可以通過想要挖掘什么標簽來反推需要的數據源。
數據清洗:原始數據源存在“臟數據”,包括數據空缺和噪聲、不一致、重復、錯誤等問題,為了保證后期挖掘的准確性,避免對決策造成影響,須對原始數據進行預處理。
數據標准化:用戶畫像的建立需要有整合多源數據(跨屏跨媒體)的能力,例如一個實體可能使用多個設備,擁有網絡世界的多個賬號,則須把多個身份ID組合,建立統一的標准,才能完整標識實體的用戶畫像。
用戶建模:通過算法模型來定義人群的用戶畫像,常見為分類模型和聚類模型,例如朴素貝葉斯、決策樹、SVM,神經網絡,k-means等。
標簽挖掘:通過平台來進行標簽的加工和計算,通常需要部署環境,如通過Hadoop平台進行訓練和學習,大規模的並行計算。
標簽驗證:須通過真實case驗證標簽挖掘結果的正確性,保證標簽對應的處理結果跟預期大體相符。此步驟有時可以跟上個步驟(標簽挖掘)對調,即可以先用小樣本數據驗證模型的可靠性,再依照結果進行調整,再進行挖掘。
數據可視化:即視覺呈現群體或個人的用戶畫像,包括柱狀圖/餅狀圖/表格等,可根據實際情況選擇合適的可視化方式。
################################################TDengine數據庫#############################################################
一、通用
1.登錄tdengine
taos -uroot -proot
2.查看所有庫
SHOW DATABASES;
3.查看所有表
#查看表需要先選擇庫 show tables;
4.選擇庫
use database;
5.刪除庫
DROP DATABASE test;
6.刪除表
DROP TABLE 庫.表;
二、表操作
1.創建表
#利用命令建立表chen,有3個字段:ts 時間戳,temperature 溫度,humidity 濕度,city 城市 create table if not exists chen(ts timestamp, temperature int, humidity float, city char);
2.查看表結構
#指定庫查看表結構 DESCRIBE 庫.chen; #不指定庫查看(需要先選中庫) DESCRIBE chen;
3.插入數據到表
insert into chen(ts, temperature, humidity, city) values (now, 25, 27.3,'天津');
4.查詢表記錄
#查詢全部 SELECT * from test.chen; #只顯示部分列 SELECT ts,city from test.chen; #where條件查詢 SELECT ts,city from test.chen where city='天津'; #where和and SELECT ts,city from test.chen where city='天津' and temperature=50;
相關鏈接:
https://blog.csdn.net/u013043346/article/details/77712408 ..........................................用戶畫像
https://zhuanlan.zhihu.com/p/77078253 ........................................................................用戶畫像
https://blog.csdn.net/sysmedia/article/details/72801......................................................標簽系統
https://blog.51cto.com/zhaoshilei/2084316,https://blog.csdn.net/raqsoft/article/details/85236517 ....................................數據脫敏介紹
https://blog.csdn.net/yqling2008/article/details/84742200,https://www.cnblogs.com/xxeleanor/p/13910953.html ..............影子庫介紹
https://coffee.pmcaff.com/article/2485889755697280/pmcaff?utm_source=forum&ivk_sa=1024320u ..............................數據埋點介紹
https://blog.csdn.net/kangweijian/article/details/126773054 ......................................TDengine 入門教程增刪改查
https://blog.csdn.net/weixin_43296313/article/details/124151070 .............................TDengine連接及認證
https://blog.csdn.net/weixin_43296313/article/details/120648296 .............................docker搭建TDengine