將word2vec思想拓展到序列item的2vec方法並運用到推薦系統中,實質上可以認為是一種cf
在word2vec中,doc中的word是具有序列關系的,優化目標類似在max對數似然函數
應用在item2vec上,可以有兩種看待方式:
(1)如果item是強時序關系的,那么對某一次序列中的item,可以看成doc中的word,對其進行word2vec
(2)如果item是set-based,不用考慮時序,那么可能需要對word2vec進行變形
論文中對第二種情況進行了描述,有兩種變形方式
(1)改變滑動窗口,不再使用定長c,還是根據set的size靈活變化(也就是對整個set里的word進行兩兩組合成樣本)
(2)在訓練過程中對每個set隨機shuffle
論文中使用的兩個數據集,一是用戶收聽的音樂歌手數據,一個是訂單以及其中goods的數據
在推薦上,可以是用戶一次瀏覽序列里面的item,用戶豆列里的item,等等
可以看到word2vec在構建集合內item關系時很有用處
參考: