1)什么是用戶興趣?
指用戶在使用某APP時,所表現的行為傾向性,APP會根據用戶的一系列行為表現來確實用戶的興趣。
2)興趣模型的分類
按時間:長期興趣,短期興趣;長期興趣指不容易隨着時間而變化的興趣,相對穩定;短期興趣指變化比較頻繁的興趣。
按表現:顯式的興趣;隱式的興趣;顯式興趣指用戶能顯式並願意主動顯示的興趣,如用戶選擇性別傾向,訂閱頻道;隱式興趣指用戶難以直接表述的,但是潛在的用戶會不自覺有相關傾向。如用戶常打開APP的時間,常瀏覽和點擊的內容。
按對象:按照傾向的對象來分,如購買的興趣,交叉的興趣,閱讀的興趣,不同的興趣具有一定的關聯。需要識別的行為操作也不一樣。
3)興趣模型的作用:(1)認識用戶,直接作一些簡單的推薦;(2)在推薦系統的排序模塊中加入相關信息,以對推薦候選集進行排序和過濾。(3).......
4)用戶興趣模型的表示方法:用 向量空間模型(Vector Space Model, VSM)來進行表示,即{(t1,w1),(t2,w2),....((tn,wn))}; 其中t1表示特征項,w1表示t1在在模型中的權重,即用戶對興趣t1的感興趣程度。
5)具體的設計構建
在本應用中,用是對用戶興趣按時間進行划分,即分成長期興趣和短期興趣。
其中長趣興趣是按照一定的策略產生,它主要保存着所感興趣的大的類別型標簽,對應着數據庫中商品的二級類目,如“數碼”,“箱包”,“游戲” 等,並給與一定的權重。
短期興趣的時間窗口包含二個,分別是一周、一個月,它是基於統計的方法得到的。在此以一周為例,如以“數碼”類目為例,其對應的層次結構如下:
- categoryname:“數碼”
- weight:5.6
- tags: [ (name, weight) ]
- brands: [ (name, weight) ]
- behaviors[(name,weight)] ##輔助用的,可刪除
6)實踐過程中的關鍵點(有一些暫時未用到和解決):
對於長期的興趣:
Interest(0) = 基於統計得到,統計這一段時間,用戶對類別行為類型和行為,行為次數。
Interestnew 也是基於統計得到的。
其興趣的合並公式如下:
Interestnow = (1-λ) Interestold + λ* Interestnew
λ的值與用戶這段時間內的活躍度 和總體用戶的活躍度相關。
在計算用戶長趣興趣時 1)設置最低閾值,保留最感興趣的N個興趣點(如10個)
2)根據用戶的活躍度,設置多檔的衰減速度λ
3)設置最低的變化率,如果用戶這一段時間內行為次數不夠,不會引起變化。
長期興趣模型生成的注意點(短期的興趣:是基於統計得到的,統計過程中要考慮的點):
- 用戶行為操作的權重:不同的操作,其權重也不同,如用戶購買和點擊的權重不一樣。
解決方法: 初始化時,根據總體用戶的操作比例結合常識來對用戶的行為權重進行初始化。
針對用戶的操作傾向進行個性化的調整,如用戶偏愛瀏覽,但不常加入購物車,偶爾加入購物車,
則其加入購物車的權重會有一定的增加(暫時未加入)
【現用的是 對於每一個用戶,根據對用戶的操作比例進行平滑,並的計算,原則是:】
2. 流行物品熱度的權重:對熱門物品進行懲罰,對冷門物品進行加權
3. 標簽的權重問題:使用類似於TF-IDF的方式來計算其權重。
4. 用戶活躍度的因素:分箱來進行處理,它會影響到 行為的權重、衰減的速度。
5. 行為在時間上的衰減 (長):越早的行為對用戶當前的興趣表現越弱,所以對於歷史的興趣,在與新的興趣進行合並時得
進行衰減。
附:
實現過程中關鍵因子:
參考:https://blog.csdn.net/ytbigdata/article/details/49488897
https://wenku.baidu.com/view/3beeb1d4941ea76e58fa0446.html