前面將數據及其來源進行了梳理,讓我們對B2C網站可能出現的數據有了大概了解。但如何對這些數據進行組織、描述、分類,以便於日常使用呢?
一、從查詢說起
常用查詢方式主要有條件查詢、模糊查詢。
1.條件查詢相對比較簡單,通過選擇一定條件,實現查詢/篩選功能。例如下圖中的紅色框部分。
2.模糊查詢又稱作關鍵字/自定義查詢,主要通過關鍵字匹配,實現查詢功能。如下圖中的藍色框部分。
圖1 查詢的常用方式
無論何種查詢方式,都是通過程序語句對后台數據庫進行查詢操作,所以我們需要對數據在入庫前進行命名描述、分類匯總,才能通過各種查詢方式得到想要的結果,這一步驟就稱為標簽處理。
二、那什么是標簽呢?
在梳理數據時,我們了解這些數據分別代表的意義,但只了解意義遠遠不夠,更需要站在業務應用角度,去判斷、理解數據所代表的意義。
例:如果單純從用戶背景資料(性別、生日等)分析,不同性別用戶對產品需求會有差異。但運營需要更進一步分析,希望數據能更多更有用信息,所以在數據准備上,可以將性別、年齡與用戶行為進行交叉分析,以便得出更為精確的結果。
圖2 基於用戶背景資料與用戶行為的交叉分析
“性別、年齡”對我們是可見的,即可以通過這兩項找到相應的用戶。但對數據庫而言“性別、年齡”僅僅是文字表現,是通過該文字表現關聯到用戶,所以它們就像每個人的名字,可以關聯到相應的人一樣,而這就是標簽。
因此,標簽只是一種內容組織方式,是一種關聯性很強的關鍵字,能很方便的幫助我們找到合適的內容及內容分類。
三、標簽和標簽體系
標簽解決的是描述(或命名)的問題,但在實際應用中,還需要解決數據之間的關聯。所以,我們通常將標簽作為一個體系來設計,從而解決數據之間的關聯問題。
一般來說,將能關聯到具體用戶數據的標簽,稱為葉子標簽。對葉子標簽進行分類匯總的標簽,稱為父標簽。父標簽和葉子標簽共同構成標簽體系,但兩者是相對概念。例如:下表中,地市、型號在標簽體系中相對於省份、品牌,是葉子標簽。
表1:某網站標簽體系示例
一級標簽 |
二級標簽 |
三級標簽 |
四級標簽 |
移動屬性 |
用戶所在地 |
省份 |
地市 |
手機品牌 |
品牌 |
型號 |
|
業務屬性 |
用戶等級 |
普通 |
|
音樂普通會員 |
|||
音樂高級會員 |
|||
音樂VIP會員 |
四、用戶標簽體系與商品標簽體系
B2C網站解決用戶買東西的問題,所以網站涉及到兩套獨立標簽體系:用戶標簽體系和商品標簽體系。
1.用戶標簽體系
對用戶進行分類、識別的體系,包括用戶基本屬性標簽(性別、年齡、家庭狀況等)、用戶行為標簽(點擊行為、訂購行為等)、用戶運營標簽(運營渠道標簽、活動標簽等)。
表2:用戶標簽體系示例
一級標簽 |
二級標簽 |
三級標簽 |
四級標簽 |
基本屬性 |
性別 |
男 |
|
女 |
|||
年齡段 |
18歲以下 |
||
…… |
|||
55歲以上 |
|||
行為屬性 |
Web行為 |
Web登錄行為 |
|
收藏 |
|||
到貨通知 |
|||
購買 |
2.商品標簽體系
對商品進行分類的體系,包括商品基本屬性標簽(名稱、類別、規格等)、商品關聯標簽(類別關聯、規格關聯等)、商品情感標簽(甜美、可愛等)
表3:商品標簽體系示例
一級標簽 |
二級標簽 |
三級標簽 |
四級標簽 |
基本屬性 |
類別 |
數碼產品 |
|
母嬰產品 |
|||
規格 |
L |
||
M |
|||
S |
3.兩者關系
五、以標簽管理系統結束
標簽體系相對比較復雜,那如何對標簽體系進行科學管理,例如“標簽的增加、刪除、修改、查詢等”工作?這就是我們接下來要討論的“標簽管理系統”。