用戶興趣的模型 淺析


1)什么是用戶興趣?

  指用戶在使用某APP時,所表現的行為傾向性,APP會根據用戶的一系列行為表現來確實用戶的興趣。

2)興趣模型的分類

  按時間:長期興趣,短期興趣;長期興趣指不容易隨着時間而變化的興趣,相對穩定;短期興趣指變化比較頻繁的興趣。

  按表現:顯式的興趣;隱式的興趣;顯式興趣指用戶能顯式並願意主動顯示的興趣,如用戶選擇性別傾向,訂閱頻道;隱式興趣指用戶難以直接表述的,但是潛在的用戶會不自覺有相關傾向。如用戶常打開APP的時間,常瀏覽和點擊的內容。

  按對象:按照傾向的對象來分,如購買的興趣,交叉的興趣,閱讀的興趣,不同的興趣具有一定的關聯。需要識別的行為操作也不一樣。

3)興趣模型的作用:(1)認識用戶,直接作一些簡單的推薦;(2)在推薦系統的排序模塊中加入相關信息,以對推薦候選集進行排序和過濾。(3).......

4)用戶興趣模型的表示方法:用 向量空間模型(Vector Space Model, VSM)來進行表示,即{(t1,w1),(t2,w2),....((tn,wn))}; 其中t1表示特征項,w1表示t1在在模型中的權重,即用戶對興趣t1的感興趣程度。

5)具體的設計構建

在本應用中,用是對用戶興趣按時間進行划分,即分成長期興趣和短期興趣。

其中長趣興趣是按照一定的策略產生,它主要保存着所感興趣的大的類別型標簽,對應着數據庫中商品的二級類目,如“數碼”,“箱包”,“游戲” 等,並給與一定的權重。

短期興趣的時間窗口包含二個,分別是一周、一個月,它是基於統計的方法得到的。在此以一周為例,如以“數碼”類目為例,其對應的層次結構如下:

  • categoryname:“數碼”
  • weight:5.6
    • tags: [ (name, weight) ]
    • brands: [ (name, weight) ]
    • behaviors[(name,weight)]  ##輔助用的,可刪除

6)實踐過程中的關鍵點(有一些暫時未用到和解決):

  對於長期的興趣:

  Interest(0) =  基於統計得到,統計這一段時間,用戶對類別行為類型和行為,行為次數。

   Interestnew  也是基於統計得到的。

  其興趣的合並公式如下:

            Interestnow  = (1-λ) Interestold + λ* Interestnew 

            λ的值與用戶這段時間內的活躍度 和總體用戶的活躍度相關。

            在計算用戶長趣興趣時 1)設置最低閾值,保留最感興趣的N個興趣點(如10個)

                      2)根據用戶的活躍度,設置多檔的衰減速度λ

                      3)設置最低的變化率,如果用戶這一段時間內行為次數不夠,不會引起變化。

  長期興趣模型生成的注意點(短期的興趣:是基於統計得到的,統計過程中要考慮的點):

  1.   用戶行為操作的權重:不同的操作,其權重也不同,如用戶購買和點擊的權重不一樣。

      解決方法:  初始化時,根據總體用戶的操作比例結合常識來對用戶的行為權重進行初始化。

            針對用戶的操作傾向進行個性化的調整,如用戶偏愛瀏覽,但不常加入購物車,偶爾加入購物車,

            則其加入購物車的權重會有一定的增加(暫時未加入)

     【現用的是 對於每一個用戶,根據對用戶的操作比例進行平滑,並的計算,原則是:】

  2.   流行物品熱度的權重:對熱門物品進行懲罰,對冷門物品進行加權

  3.  標簽的權重問題:使用類似於TF-IDF的方式來計算其權重。

  4.  用戶活躍度的因素:分箱來進行處理,它會影響到 行為的權重、衰減的速度。

  5.   行為在時間上的衰減 (長):越早的行為對用戶當前的興趣表現越弱,所以對於歷史的興趣,在與新的興趣進行合並時得

     進行衰減。

    附:

    

    

    

    

    

    

實現過程中關鍵因子:

    

    

    

    

參考:https://blog.csdn.net/ytbigdata/article/details/49488897
     https://wenku.baidu.com/view/3beeb1d4941ea76e58fa0446.html

 


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM