用戶畫像和標簽及TDengine數據庫


概述:

   在數據越來越值錢的年代,用戶畫像和標簽也被熱議了許久。無論你身處IT部門還是業務部門,一定都聽說過用戶畫像或者標簽,甚至有不少人基於此開展各項日常工作。

 

 

1. 標簽

對某一類特定群體或對象的 某項特征進行的抽象分類和概括,其值(標簽值)具備可分類性。

例如:

  • 對於“人”這類群體,可將“男”、“女”這類特征進行抽象概括,統稱為“性別”,“性別”即一個標簽;
  • 對於“手機”這類對象,可將“高通”、“海思” 這類特征進行抽象概括,統稱為“手機處理器”,“手機處理器”即一個標簽。

 

2.標簽系統

標簽和用戶畫像的整合應用中心,通常由標簽、標簽樹、畫像中心構成。

 

3.用戶畫像

由某一特定群體或對象的多項特征構成,輸出結果通常是對特征的具體描述。(也可理解為用戶畫像是由多個標簽組合而成,其實例是由多個標簽值構成)。

用戶畫像 = 自我介紹

例如:

1.小明是用戶畫像的一個實例, 小明的輸出結果為“男“、“20”、“iPhone”、“北京”、“足球”,是由多個標簽中的具體標簽值構成。

2.我的一個好友叫王小震,25歲,摩羯座,從事軟件開發工作,超級無敵工作狂,平時喜歡外出爬山,打球、喜歡看書,類型多偏技術和管理,偶爾玩玩LOL等游戲,喜歡美食,但對海鮮過敏,目前還是單身狗一只……

 

#看完之后,是不是感到這個人物十分清晰了?這是因為一個完整的人物畫像已經呈現在了你的腦海里。當標簽被描述得越多,你的用戶畫像就越清晰。

#理論上來說,先要有標簽才能組件用戶畫像

 

4.做用戶畫像的意義

a.從公司戰略層面來說,好的用戶畫像可以幫助企業進行市場洞察、預估市場規模,從而輔助制定階段性目標,指導重大決策,提升ROI;更有助於避免同質化,進行個性化營銷。

b.從產品本身角度來說,用戶畫像可以圍繞產品進行人群細分,確定產品的核心人群,從而有助於確定產品定位,優化產品的功能點。例如美妝類app,則前期可大致鎖定畫像一二線城市,喜歡時尚,年齡段在18至35之間的女性。

c.從數據管理角度來說,用戶畫像有助於建立數據資產,挖掘數據的價值,使數據分析更為精確,甚至可以進行數據交易,促進數據流通。互聯網營銷行業中常用的DMP(Data Management Platform)就是用戶畫像使用的一個好例子。

 

5.用戶畫像的基本要素

用戶畫像主要從靜態屬性、動態屬性、消費屬性和心理屬性來划分。

靜態屬性是勾勒用戶畫像的基礎:性別、年齡、學歷、角色、收入、地域、婚姻等。

動態屬性是指用戶在互聯網上的上網行為、娛樂偏好、社交習慣、出行方式以及獲取知識的方式,這些都直接反應了用戶對你的內容是否感興趣。

消費屬性是指用戶的消費水平、消費心理、消費嗜好等,這反映的是用戶對花錢有什么看法。到底是喜歡質量好的還是追求品質高的呢?到底是傾向於功能價值還是情感價值?

心理屬性是指用戶在生活、工作、情感、社交等方面所擁有的個人價值觀。

 

6.構建用戶畫像的步驟

采集數據:數據的來源有多種,很多公司有自己的CRM系統,或者有智能采集系統日志的工具,常用的采集方式包括API、SDK和傳感器采集等,可以通過想要挖掘什么標簽來反推需要的數據源。

數據清洗:原始數據源存在“臟數據”,包括數據空缺和噪聲、不一致、重復、錯誤等問題,為了保證后期挖掘的准確性,避免對決策造成影響,須對原始數據進行預處理。

數據標准化:用戶畫像的建立需要有整合多源數據(跨屏跨媒體)的能力,例如一個實體可能使用多個設備,擁有網絡世界的多個賬號,則須把多個身份ID組合,建立統一的標准,才能完整標識實體的用戶畫像。

用戶建模:通過算法模型來定義人群的用戶畫像,常見為分類模型和聚類模型,例如朴素貝葉斯、決策樹、SVM,神經網絡,k-means等。

標簽挖掘:通過平台來進行標簽的加工和計算,通常需要部署環境,如通過Hadoop平台進行訓練和學習,大規模的並行計算。

標簽驗證:須通過真實case驗證標簽挖掘結果的正確性,保證標簽對應的處理結果跟預期大體相符。此步驟有時可以跟上個步驟(標簽挖掘)對調,即可以先用小樣本數據驗證模型的可靠性,再依照結果進行調整,再進行挖掘。

數據可視化:即視覺呈現群體或個人的用戶畫像,包括柱狀圖/餅狀圖/表格等,可根據實際情況選擇合適的可視化方式。

 

################################################TDengine數據庫#############################################################

一、通用 

1.登錄tdengine

taos -uroot -proot

2.查看所有庫

SHOW DATABASES;

3.查看所有表

#查看表需要先選擇庫
show tables;

4.選擇庫

use database;

5.刪除庫

DROP DATABASE test;

 6.刪除表

DROP TABLE 庫.表;

 

二、表操作

1.創建表

#利用命令建立表chen,有3個字段:ts 時間戳,temperature 溫度,humidity 濕度,city 城市
create table if not exists chen(ts timestamp, temperature int, humidity float, city char);

2.查看表結構

#指定庫查看表結構
DESCRIBE 庫.chen;

#不指定庫查看(需要先選中庫)
DESCRIBE chen;

3.插入數據到表

insert into chen(ts, temperature, humidity, city) values (now, 25, 27.3,'天津');

4.查詢表記錄

#查詢全部
 SELECT * from test.chen;

#只顯示部分列
SELECT  ts,city from test.chen;

#where條件查詢
SELECT  ts,city from test.chen where city='天津';

#where和and
SELECT  ts,city from test.chen where city='天津' and temperature=50;

 

 

 

 

 

相關鏈接:

https://blog.csdn.net/u013043346/article/details/77712408 ..........................................用戶畫像

https://zhuanlan.zhihu.com/p/77078253 ........................................................................用戶畫像

https://blog.csdn.net/sysmedia/article/details/72801......................................................標簽系統

https://blog.51cto.com/zhaoshilei/2084316https://blog.csdn.net/raqsoft/article/details/85236517 ....................................數據脫敏介紹

https://blog.csdn.net/yqling2008/article/details/84742200https://www.cnblogs.com/xxeleanor/p/13910953.html ..............影子庫介紹

https://coffee.pmcaff.com/article/2485889755697280/pmcaff?utm_source=forum&ivk_sa=1024320u ..............................數據埋點介紹

https://blog.csdn.net/kangweijian/article/details/126773054 ......................................TDengine 入門教程增刪改查 

https://blog.csdn.net/weixin_43296313/article/details/124151070 .............................TDengine連接及認證

https://blog.csdn.net/weixin_43296313/article/details/120648296 .............................docker搭建TDengine

 


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM