個性化推薦系統由亞馬遜電子商務公司、Netflix電影租賃公司,在線上業務大力使用推薦系統,並大力通過文章、競賽形式宣傳推薦系統。使得個性化推薦系統在電商領域及其受歡迎,並且個性化推薦技術應用到線上個頻道,相比於運營配置產品數據,uv、pv、gmv點擊轉化、訂單轉化均是大漲個別業務接入個性化推薦系統后數據漲幅高達400%-500%。
個性化技術在線上商品業務上效果明顯,也加速個性化推薦技術使用的深度、廣度。
商品推薦特征明顯,商品本身和文章、新聞存在較大差異,本身存在交易屬性。 如果推薦不准確用戶很難去點擊、去瀏覽、去購買。購買本身比新聞、文章轉化成本高很多,所以准確性對於商品推薦極其重要。
商品推薦一般基於用戶偏好模型,用戶偏好模型根據用戶歷史瀏覽、下訂單、加購物車、搜索、點贊、收藏、評論等行為,通過邏輯回歸LR模型離線訓練構成用戶離線偏好模型,離線模型一般通過map reduce計算。
為了對用戶在線實時操作進行反饋,用戶實時瀏覽、點擊、加購物車等操作用過用戶客戶端上報,storm或spark steaming流式計算生成實時用戶偏好。
商品信息有別於文章、新聞等,有明顯分類信息,就是商品品類。商品偏好信息是關於用戶與二級品類、三級品類關系,這樣用戶與商品關系抽象為與品類關系。可以減少很多計算,試想幾億用戶、幾億商品關系計算將需要耗費多少時間,時間計算還好,現在有分布式系統。對於商品、用戶關系進行存儲更是極大難題,一是存儲空間巨大,一是訪問不滿足線上服務性能需要。
實際線上商品推薦系統,根據實際離線品類偏好、實時品類偏好。根據偏好拉取商品品類下商品,商品要進行已購買品類過濾。
素材如果不夠就要進行補充,怎么補充補充什么素材就很重要。一種思路是補充熱門素材信息、熱門素材信息對相當一部分人都有很大吸引力。另一種是補充降價促銷力度大商品,降價力度越大對用戶吸引越大。並且素材信息要不斷進行更新,以保證降價信息、是否有貨信息准確無誤,避免用戶點擊后信息不存在。
根據商品、素材拉取用戶特征、品類特征、素材特征、用戶素材交互特征、上下文特征、用戶手機信息、地理位置等多個維度30幾個特征,傳入訓練出來GBDT模型,進行線上點擊量預估,估計用戶對於素材點擊量幾率,根據幾率排序商品。
對於用戶返回要進行過濾,一是曝光過濾給用戶展示過得,不要在進行展示,避免浪費位置。一是過濾用戶已購買,用戶已購買商品品類要進行過濾,避免已購買商品推薦,會給用戶感覺很煩,並且感覺系統總是推薦購買物品,用戶會對推薦失去信心。再有就是無貨過濾,要增加GMV轉化,那么推出產品用戶點擊查看后,想要購買商品沒有那也浪費曝光,並且對用戶很不友好。
模型排序出素材,直接返回。可能會出現6個手機、5雙鞋連在一起,用戶體驗差也會嚴重影響用戶體驗。也會降低用戶點擊率、加購率、訂單轉化率等指標。通過算法按三級品類、二級品類進行隔斷開這是一種品類隔斷方式。另一種是根據用戶偏好商品品類信息,對多個品類進行輪詢,每個品類選一個素材,執行多輪直到選夠一次返回素材。
通過這一系列復雜邏輯,終於完成一次用戶商品推薦。
微信搜索:mydevclub