7.1 外圍架構
7.2 推薦系統架構
- 基於特征的推薦系統架構
- 用戶喜歡的物品、用戶相似的用戶也可以抽象成特征;
- 基於特征的推薦系統核心任務就被拆解成兩部分,一個是如何為給定用戶生成特征,另一個是如何根據特征找到物品;
- 用戶特征種類
-
- 屬性特征
- 行為特征
- 話題特征:可應用主題模型生成
-
- 推薦系統架構構成
- 推薦系統可由多個推薦引擎組成,每個推薦引擎負責一類特征或一種任務,而推薦系統的任務只是將推薦引擎的結果按照一定權重或者優先級進行合並、排序然后返回
- 使用搜索引擎的好處:
- 方便增/刪引擎,控制不同引擎對推薦結果的影響,對絕大多數需求,通過不同的引擎組合實現;
- 實現推薦引擎級別的用戶反饋,可對不同的用戶給出不同的引擎組合權重。
7.3 推薦引擎架構
(1)用戶特征向量生成模塊
特征向量由特征和特征權重組成,計算時需要考慮:
- 用戶行為的總類:一般標准就是用戶付出代價越大的行為權重越高。
- 用戶行為產生的時間
- 用戶行為次數
- 物品的熱門程度:冷門物品權重較高(用戶對很熱門的物品產生的行為往往不能代表用戶個性,因為用戶可能是在跟風)
(2)特征 — 物品相關推薦模塊
可以用不同方式計算多張相關表,然后在配置表中配置表與權重,最終應用時加權組合。
(3)過濾模塊
- 用戶已經產生過行為物品
- 候選物品以外的物品,由於業務需求或者用戶自己限定
- 低質量/評論物品
(4)排名模塊
- 新穎性排名:用戶不知道、長尾中的物品。
- 多樣性排名:覆蓋率,一種是推薦結果按物品內容屬性分類,在每類中選擇排名最高的物品;二是控制不同推薦結果的推薦理由出現次數,推薦結果來自不同特征,具有不同推薦理由;
- 時間多樣性
- 用戶反饋:通過分析用戶之前和推薦結果的交互日志,預測用戶會對什么樣的推薦結果比較感興趣(點擊預測模型)。