電商推薦算法


一、 電商推薦算法簡述

目前比較多的電商模式為B2B,B2C,O2O,在本文介紹和需要舉例說明的地方B2B電商模式為主。

電商推薦根據推薦內容不同分為物品推薦、商家推薦;流行的推薦應用主要有三個方面:1)針對用戶的瀏覽、搜索等行為所做的相關推薦;2)根據購物車或物品收藏所做的相似物品推薦;3)根據歷史會員購買行為記錄,利用推薦機制做郵件推送或會員營銷。其中推薦算法主要分為以下幾個類: 

1、基於用戶的協同過濾推薦算法

a. 找到與目標用戶興趣相似的用戶集合

b. 找到這個集合中用戶喜歡的、並且目標用戶沒有聽說過的物品推薦給目標用戶

2、基於Item(項目)的協同過濾推薦算法

  a.基於用戶對某商品的興趣程度,尋找出相似度最大的物品。

  b.將相似度最大的物品推薦給目標用戶。

 

協同過濾舉例:四個用戶ABCD,對5個商品abcde的興趣與否見下表(實際用戶對物品的興趣程度有區別,需要具體的評分量化),這里方便理解原理,用二元值表示用戶對物品是否感興趣。

 

a

b

c

d

e

目標物品

A

1

1

0

1

0

1

B

1

0

1

0

0

0

C

0

1

0

0

1

1

D

0

1

1

1

0

 基於用戶的協同過濾:指根據用戶對各物品的興趣度計算相似性,相似性的算法有很多(主要有余弦相似性、相關相似性以及歐式距離等),上述與用戶D相似對最高的是用戶A,用戶A對目標物品的興趣度為1,就可將目標物品推薦給用戶D。

基於item的協同過濾:指從物品維度上看,根據用戶對每個物品的興趣度,計算物品間的相似性,可以算出物品b和目標物品的相似性最大,用戶D對物品b感興趣,則很可能對目標用戶感興趣。

3、基於內容的推薦算法

商品為客觀體,提取商品對象的特征,尋找相似度比較大的物品進行推薦。系統首先對物品的屬性進行建模,通過相似度計算,發現物品A和B相似度較高,或者他們都屬於同類物品。系統還會發現某用戶喜歡物品A,由此得出結論,某用戶可能對物品B也感興趣,於是將物品B推薦給該用戶。

    基於內容的推薦算法比較容易理解,主要用到分類、聚類算法,對用戶興趣可以很好的建模,並通過對物品屬性維度的增加,獲得更好的推薦精度。但是物品的屬性有限,很難得到更多數據屬性,且對於部分物品屬性特征提取有時候比較困難,只考慮物品本身的特征,忽略用戶的行為特征,存在一定片面性,對於從未購買物品的新用戶存在冷啟動問題,不能對新用戶進行推薦。

 

4、基於關聯規則的推薦算法

  基於關聯規則的推薦是以關聯規則為基礎,把已購商品作為規則頭,規則體為推薦對象。關聯規則挖掘可以發現不同商品在銷售過程中的相關性,關聯規則就是在一個交易數據庫中統計購買了商品集X的交易中有多大比例的交易同時購買了商品集Y,其直觀的意義就是用戶在購買某些商品的時候有多大傾向去購買另外一些商品,根據某種商品所屬的置信度較高的關聯規則,推薦物品。

根據用戶的購買記錄,提取關聯規則,常用的算法有Apriori算法,為了提取頻繁項集和一定置信度的關聯規則。Apriori算法的主要原則是如果項集A是頻繁的,那么它的子集都是頻繁的。如果項集A是不頻繁的,那么所有包括它的父集都是不頻繁的,簡化頻繁項集的選擇的復雜度。

 

5、基於RFM的推薦算法

 

6、基於人口統計特征的推薦算法

  這是最為簡單的一種推薦算法,它只是簡單的根據系統用戶的基本信息發現用戶的相關程度,然后將相似用戶喜愛的其他物品推薦給當前用戶。系統首先會根據用戶的屬性建模,比如用戶的年齡,性別,興趣等信息。根據這些特征計算用戶間的相似度。比如系統通過計算發現用戶A和C比較相似。就會把A喜歡的物品推薦給C。

 

  基於人口統計特征推薦算法的優勢是不需要歷史數據,沒有新用戶冷啟動問題,不依賴於物品的屬性,不足是算法比較粗糙,效果很難令人滿意,只適合簡單的推薦。

 

7、混合推薦算法

融合以上方法,以加權或者串聯、並聯等方式盡心融合。實際應用最多的是內容推薦和協同過濾推薦的組合。最簡單的做法就是分別用基於內容的方法和協同過濾推薦方法去產生一個推薦預測結果,然后用某方法組合其結果,如加權、變換、混合、特征組合、層疊、特征擴充、元級別等。組合推薦一個最重要原則就是通過組合后要能避免或彌補各自推薦技術的弱點。

1)加權(Weight):加權多種推薦技術結果。

2)變換(Switch):根據問題背景和實際情況或要求決定變換采用不同的推薦技術。

3)混合(Mixed):同時采用多種推薦技術給出多種推薦結果為用戶提供參考。

4)特征組合(Feature combination):組合來自不同推薦數據源的特征被另一種推薦算法所采用。

5)層疊(Cascade):先用一種推薦技術產生一種粗糙的推薦結果,第二種推薦技術在此推薦結果的基礎上進一步作出更精確的推薦。

6)特征擴充(Featureaugmentation):一種技術產生附加的特征信息嵌入到另一種推薦技術的特征輸入中。

7)元級別(Meta-level):用一種推薦方法產生的模型作為另一種推薦方法的輸入

 

 

二、 各種推薦算法的優缺點

 

推薦方法

優點

缺點

協同過濾推薦

新異興趣發現、不需要領域知識;

隨着時間推移性能提高;

推薦個性化、自動化程度高;

能處理復雜的非結構化對象

稀疏問題;

可擴展性問題;

新用戶問題;

質量取決於歷史數據集;

系統開始時推薦質量差;

基於內容推薦

推薦結果直觀,容易解釋;

不需要領域知識

新用戶問題;

復雜屬性不好處理;

要有足夠數據構造分類器

基於規則推薦

能發現新興趣點;

不要領域知識

規則抽取難、耗時;

產品名同義性問題;

個性化程度低;

基於人口統計

不需要歷史數據,沒有冷啟動問題;

不依賴於物品的屬性,因此其他領域的問題都可無縫接入

算法比較粗糙,效果很難令人滿意,只適合簡單的推薦

 

 

三、 推薦算法總結 

鑒於各種推薦算法的優缺點和適應場景,系統開始與系統成熟時的推薦算法應有區別。系統開始時,用戶數據不夠多,交易行為記錄數據比較少,倘若利用基於內容和協同過濾的推薦算法存在很多新用戶冷啟動問題。在系統成熟時,用戶交易數據較多,部分算法用到矩陣,產生較大的稀疏矩陣數據,運算量大,需要結合組合推薦法。總結B2B電商平台在系統初和系統成熟時的推薦算法建議:

  系統初可使用的推薦方法:

1、基於人口統計、熱搜、瀏覽記錄

    基於人口統計的推薦:通過注冊以及詢問得知一些用戶的屬性信息,譬如年齡、居住城市、受教育程度、性別、職業等等,能夠得到用戶之間屬性的相似度;

    熱搜:站內熱搜,按排名進行推薦;

    基於瀏覽記錄的內容的推薦:部分產品的內容特征比較好提取,比如帶文字描述的產品,也有內容特征比較難提取的,如圖片,或者瀏覽的商品不詳,則需要人工或智能爬取相關信息。總的來說,這一部分的推薦是基於用戶瀏覽的內容,通過提取特征,計算相似度,推薦相似產品(相似產品的推薦精確度可能比較難達到要求,通過提高粒度,進行品類推薦是常見做法)。

2、標簽系統

    利用標簽也只能是提高有少量行為的用戶的推薦准確性,對於純粹的冷啟動用戶,是沒有幫助的,因為這些人還沒有打過任何標簽。系統也可以給商品打上標簽,但是這里面沒有個性化的因素,效果會打一個折扣。從這個意義上講,利用標簽進行推薦、激勵用戶打標簽以及引導用戶選擇合適的標簽,都非常重要。引導用戶多打標簽,通過標簽進行分類推薦也是常用的方法

3、多維數據的利用

每個人處於一個巨大的社會網絡中,在多個網站存在行為數據,相當比例的用戶都具有交叉購物的習慣,把這些網絡數據整合起來,特別是知道每個節點身份的對應關系,可以帶來的巨大的社會經濟價值。使用‘遷移學習法’,可以實現跨領域的推薦。多維數據的利用能解決新用戶的冷啟動問題。

神州商橋的用戶來自本來的用戶群的比例應該很大,從其它的數據接口獲取數據源,獲得用戶的基礎信息。

 

系統成熟時可使用的推薦方法: 

1、 協同過濾推薦法

2、 基於內容的推薦法

3、 基於關聯規則,用戶與用戶之間的關聯,商品與商品之間的關聯

4、 組合推薦法(協同過濾和基於內容的推薦的結合)

    這三個推薦法在電商系統成熟時應用的比較多,行為數據充足使得這些算法的推薦效果比較好,然而在數據量級特別大的時候存在數據稀疏問題,一般采用的解決辦法是把這些商品信息粗粒化,譬如只考慮一個個的品類,數據就會立刻變得稠密。如果能夠計算品類之間的相似性,就可以幫助進行基於品類的推薦。

 

四、推薦算法評價指標

   准確度、多樣性、新穎性和覆蓋率。每一類下轄很多不同的指標,譬如准確度指標又可以分為四大類,分別是預測評分准確度、預測評分關聯、分類准確度、排序准確度四類。第二個層次是商業應用上的關鍵表現指標,譬如受推薦影響的轉化率,購買率,客單價,購買品類數等等,第三個層次是用戶真實的體驗,注意保護用戶隱私。


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM