底層數據庫規划之一搭建標簽體系


前面將數據及其來源進行了梳理,讓我們對B2C網站可能出現的數據有了大概了解。但如何對這些數據進行組織、描述、分類,以便於日常使用呢?

一、從查詢說起

常用查詢方式主要有條件查詢、模糊查詢。

1.條件查詢相對比較簡單,通過選擇一定條件,實現查詢/篩選功能。例如下圖中的紅色框部分。

2.模糊查詢又稱作關鍵字/自定義查詢,主要通過關鍵字匹配,實現查詢功能。如下圖中的藍色框部分。

圖1 查詢的常用方式

無論何種查詢方式,都是通過程序語句對后台數據庫進行查詢操作,所以我們需要對數據在入庫前進行命名描述、分類匯總,才能通過各種查詢方式得到想要的結果,這一步驟就稱為標簽處理。

二、那什么是標簽呢?

在梳理數據時,我們了解這些數據分別代表的意義,但只了解意義遠遠不夠,更需要站在業務應用角度,去判斷、理解數據所代表的意義。

例:如果單純從用戶背景資料(性別、生日等)分析,不同性別用戶對產品需求會有差異。但運營需要更進一步分析,希望數據能更多更有用信息,所以在數據准備上,可以將性別、年齡與用戶行為進行交叉分析,以便得出更為精確的結果。

圖2 基於用戶背景資料與用戶行為的交叉分析

“性別、年齡”對我們是可見的,即可以通過這兩項找到相應的用戶。但對數據庫而言“性別、年齡”僅僅是文字表現,是通過該文字表現關聯到用戶,所以它們就像每個人的名字,可以關聯到相應的人一樣,而這就是標簽

因此,標簽只是一種內容組織方式,是一種關聯性很強的關鍵字,能很方便的幫助我們找到合適的內容及內容分類

三、標簽和標簽體系

標簽解決的是描述(或命名)的問題,但在實際應用中,還需要解決數據之間的關聯。所以,我們通常將標簽作為一個體系來設計,從而解決數據之間的關聯問題。

一般來說,將能關聯到具體用戶數據的標簽,稱為葉子標簽。對葉子標簽進行分類匯總的標簽,稱為父標簽。父標簽和葉子標簽共同構成標簽體系,但兩者是相對概念。例如:下表中,地市、型號在標簽體系中相對於省份、品牌,是葉子標簽。

表1:某網站標簽體系示例

一級標簽

二級標簽

三級標簽

四級標簽

移動屬性

用戶所在地

省份

地市

手機品牌

品牌

型號

業務屬性

用戶等級

普通

 

音樂普通會員

 

音樂高級會員

 

音樂VIP會員

 

四、用戶標簽體系與商品標簽體系

B2C網站解決用戶買東西的問題,所以網站涉及到兩套獨立標簽體系:用戶標簽體系和商品標簽體系。

1.用戶標簽體系

對用戶進行分類、識別的體系,包括用戶基本屬性標簽(性別、年齡、家庭狀況等)、用戶行為標簽(點擊行為、訂購行為等)、用戶運營標簽(運營渠道標簽、活動標簽等)。

表2:用戶標簽體系示例

一級標簽

二級標簽

三級標簽

四級標簽

基本屬性

性別

 

 

年齡段

18歲以下

 

……

 

55歲以上

 

行為屬性

Web行為

Web登錄行為

 

收藏

 

到貨通知

 

購買

 

2.商品標簽體系

對商品進行分類的體系,包括商品基本屬性標簽(名稱、類別、規格等)、商品關聯標簽(類別關聯、規格關聯等)、商品情感標簽(甜美、可愛等)

表3:商品標簽體系示例

一級標簽

二級標簽

三級標簽

四級標簽

基本屬性

類別

數碼產品

 

母嬰產品

 

規格

L

 

M

 

S

 

3.兩者關系

用戶標簽和商品標簽並非相互獨立,會因為用戶點擊、購買等行為產生關聯。
圖3 用戶標簽與產品標簽之間的關聯

五、以標簽管理系統結束

標簽體系相對比較復雜,那如何對標簽體系進行科學管理,例如“標簽的增加、刪除、修改、查詢等”工作?這就是我們接下來要討論的“標簽管理系統”。


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM