一、摘要
本文提出一種方法,將神經語言模型應用在用戶購買時間序列上,將產品嵌入到低維向量空間中。結果,具有相似上下文(即,其周圍購買)的產品被映射到嵌入空間中附近的向量。
二、模型:
低維項目向量表示:
1、prod2vec:
給定當前產品pi,觀察到鄰居產品p i+j的概率為P(p i+j | pi)。
其中,vp和vp'是產品p的輸入和輸出向量表示。c是產品序列的上下文長度。P是字典中不重復產品的數量。S為產品實體集合。
為了考慮到同時買多個產品,提出以下模型
2、bagged-prod2vec:
產品到產品的預測模型:
1、prod2vec-topK:
給定已經購買的產品,然后在所有的產品中計算相似度,推薦前k個相似的產品。
2、prod2vec-cluster:
將相似產品進行聚類,然后從聚類的產品中進行產品推薦。
用戶到產品的預測模型:
1、user2vec:
給定一個用戶,找到聯合表征向量空間中的前K個相近的產品。
訓練數據集分為用戶購買順序S,即給定用戶un,其按照時間來排序的已經購買的產品。un = (pn1, pn2, . . . pnUn),Un表示用戶un的項目購買數量。