推薦系統實踐 0x11 NeuralCF

前言

這一篇文章我們來談一下2017年新加坡國立大學提出的基於深度學習的協同過濾模型NeuralCF。我們在之前講過矩陣分解技術，將協同過濾中的共現矩陣分解成用戶向量矩陣以及物品向量矩陣。那么Embedding的思路也是一樣的，只不過不是通過矩陣分解的形式，而是通過多層神經網絡使用Embedding構造用戶隱向量以及物品隱向量。用戶隱向量與物品隱向量的內積，就是用戶對物品的評分。這個內積的操作，同樣可以使用神經網絡層來實現，也就是前一篇文章所用的Scoring層，得到所謂的“相似度”，也就得到了評分。在實際使用中，我們往往會發現矩陣分解的模型會得到欠擬合的結果，所以深度學習可以彌補矩陣分解的結構簡單，擬合不充分的弊端。論文原文以及我找到的一篇全文翻譯的博文我貼在參考里面了，有興趣的讀者可以閱讀一下。

網絡結構

NeuralCF的網絡結構如下圖所示：

這里使用一個用戶和一個物品作為輸入特征，它使用one-hot編碼將它們轉化為二值化稀疏向量。注意到，對輸入使用這樣的通用特征表示，可以很容易地使用的內容特征來表示用戶和物品，以調整解決冷啟動問題。文章使用了多層感知機（Layer1-X）來代替了之前的內機操作，最終得到了評分。這樣做的原因：

可以使得用戶向量和物品向量充分交叉，得到更多有價值的特征組合
可以引入更多的非線性特征讓模型的表達能力更強

輸入層上面是嵌入層（Embedding Layer）;它是一個全連接層，用來將輸入層的稀疏表示映射為一個稠密向量（dense vector）。所獲得的用戶（物品）的Embedding（就是一個稠密向量）可以被看作是在潛在因素模型的上下文中用於描述用戶（項目）的潛在向量。然后我們將用戶Embedding和物品Embedding送入多層神經網絡結構，我們把這個結構稱為神經協作過濾層，它將潛在向量映射為預測分數。NCF層的每一層可以被定制，用以發現用戶-物品交互的某些潛在結構。最后一個隱含層Layer X的維度大小決定了模型的能力。

實際上，用戶和商品的互操作可以使用任意的互操作形式，這也就是廣義矩陣分解（GMF）。那么，這篇文章使用了元素積，也就是逐元素點乘（element-wise product）的形式，將用戶向量和物品向量映射到同等維度大小的空間當中，然后對應維度相乘，這樣就實現了互操作，最后再送入邏輯回歸層等輸出層，擬合最終的預測目標。GMF，它應用了一個線性內核來模擬潛在的特征交互；MLP，使用非線性內核從數據中學習交互函數。接下來的問題是：我們如何能夠在NCF框架下融合GMF和MLP，使他們能夠相互強化，以更好地對復雜的用戶-物品交互建模？為了解決這個問題，這篇文章將多種互操作結合起來，如傳統矩陣分解，多層感知機映射這兩種形式進行，然后也是用了兩種互操作，逐元素點乘以及多層感知機，如下圖所示。

公式部分

對於結合GMF和單層MLP的模型形成數學公式的話如下所示：

\[\widehat{y}_{ui}=\sigma({\bf h}^{T}a({\bf p}_u\odot{\bf q}_i)+{\bf W}\begin{bmatrix}{{\bf p}_u}\\{{\bf q}_i}\end{bmatrix}+{\bf b}) \]

整體的框架中的公式可以如下：

\[\phi^{GMF}={\bf p}_u^G\odot{\bf q}_i^G,\\\phi^{MLP}=a_{L}(W_L^T(a_{L-1}(...a_{2}(W_2^T\begin{bmatrix}{{\bf p}_u^M}\\{{\bf q}_i^M}\end{bmatrix}+{\bf b}_2)...))+{\bf b}_L),\\\widehat{y}_{ui}=\sigma({\bf h}^T\begin{bmatrix}{\phi^{GMF}}\\{\phi^{MLP}}\end{bmatrix}) \]

這里的$p^G_u$和$p^M_u$分別表示GMF部分和MLP部分的用戶嵌入（user embedding）；同樣的，$q^G_i$和$q^M_i$分別表示物品的Embedding。

代碼部分

# 廣義矩陣分解
class GMF(torch.nn.Module):
    def __init__(self, config):
        super(GMF, self).__init__()
        self.num_users = config['num_users']
        self.num_items = config['num_items']
        self.latent_dim = config['latent_dim']

        self.embedding_user = torch.nn.Embedding(num_embeddings=self.num_users, embedding_dim=self.latent_dim)
        self.embedding_item = torch.nn.Embedding(num_embeddings=self.num_items, embedding_dim=self.latent_dim)

        self.affine_output = torch.nn.Linear(in_features=self.latent_dim, out_features=1)
        self.logistic = torch.nn.Sigmoid()

    def forward(self, user_indices, item_indices):
        user_embedding = self.embedding_user(user_indices)
        item_embedding = self.embedding_item(item_indices)
        element_product = torch.mul(user_embedding, item_embedding)
        logits = self.affine_output(element_product)
        rating = self.logistic(logits)
        return rating

    def init_weight(self):
        pass


class GMFEngine(Engine):
    """Engine for training & evaluating GMF model"""
    def __init__(self, config):
        self.model = GMF(config)
        if config['use_cuda'] is True:
            use_cuda(True, config['device_id'])
            self.model.cuda()
        super(GMFEngine, self).__init__(config)

# 多層感知機
class NeuMF(torch.nn.Module):
    def __init__(self, config):
        super(NeuMF, self).__init__()
        self.config = config
        self.num_users = config['num_users']
        self.num_items = config['num_items']
        self.latent_dim_mf = config['latent_dim_mf']
        self.latent_dim_mlp = config['latent_dim_mlp']

        self.embedding_user_mlp = torch.nn.Embedding(num_embeddings=self.num_users, embedding_dim=self.latent_dim_mlp)
        self.embedding_item_mlp = torch.nn.Embedding(num_embeddings=self.num_items, embedding_dim=self.latent_dim_mlp)
        self.embedding_user_mf = torch.nn.Embedding(num_embeddings=self.num_users, embedding_dim=self.latent_dim_mf)
        self.embedding_item_mf = torch.nn.Embedding(num_embeddings=self.num_items, embedding_dim=self.latent_dim_mf)

        self.fc_layers = torch.nn.ModuleList()
        for idx, (in_size, out_size) in enumerate(zip(config['layers'][:-1], config['layers'][1:])):
            self.fc_layers.append(torch.nn.Linear(in_size, out_size))

        self.affine_output = torch.nn.Linear(in_features=config['layers'][-1] + config['latent_dim_mf'], out_features=1)
        self.logistic = torch.nn.Sigmoid()

    def forward(self, user_indices, item_indices):
        user_embedding_mlp = self.embedding_user_mlp(user_indices)
        item_embedding_mlp = self.embedding_item_mlp(item_indices)
        user_embedding_mf = self.embedding_user_mf(user_indices)
        item_embedding_mf = self.embedding_item_mf(item_indices)

        mlp_vector = torch.cat([user_embedding_mlp, item_embedding_mlp], dim=-1)  # the concat latent vector
        mf_vector =torch.mul(user_embedding_mf, item_embedding_mf)

        for idx, _ in enumerate(range(len(self.fc_layers))):
            mlp_vector = self.fc_layers[idx](mlp_vector)
            mlp_vector = torch.nn.ReLU()(mlp_vector)

        vector = torch.cat([mlp_vector, mf_vector], dim=-1)
        logits = self.affine_output(vector)
        rating = self.logistic(logits)
        return rating

    def init_weight(self):
        pass

    def load_pretrain_weights(self):
        """Loading weights from trained MLP model & GMF model"""
        config = self.config
        config['latent_dim'] = config['latent_dim_mlp']
        mlp_model = MLP(config)
        if config['use_cuda'] is True:
            mlp_model.cuda()
        resume_checkpoint(mlp_model, model_dir=config['pretrain_mlp'], device_id=config['device_id'])

        self.embedding_user_mlp.weight.data = mlp_model.embedding_user.weight.data
        self.embedding_item_mlp.weight.data = mlp_model.embedding_item.weight.data
        for idx in range(len(self.fc_layers)):
            self.fc_layers[idx].weight.data = mlp_model.fc_layers[idx].weight.data

        config['latent_dim'] = config['latent_dim_mf']
        gmf_model = GMF(config)
        if config['use_cuda'] is True:
            gmf_model.cuda()
        resume_checkpoint(gmf_model, model_dir=config['pretrain_mf'], device_id=config['device_id'])
        self.embedding_user_mf.weight.data = gmf_model.embedding_user.weight.data
        self.embedding_item_mf.weight.data = gmf_model.embedding_item.weight.data

        self.affine_output.weight.data = 0.5 * torch.cat([mlp_model.affine_output.weight.data, gmf_model.affine_output.weight.data], dim=-1)
        self.affine_output.bias.data = 0.5 * (mlp_model.affine_output.bias.data + gmf_model.affine_output.bias.data)


class NeuMFEngine(Engine):
    """Engine for training & evaluating GMF model"""
    def __init__(self, config):
        self.model = NeuMF(config)
        if config['use_cuda'] is True:
            use_cuda(True, config['device_id'])
            self.model.cuda()
        super(NeuMFEngine, self).__init__(config)
        print(self.model)

        if config['pretrain']:
            self.model.load_pretrain_weights()

小結

多種用戶向量、物品向量的Embedding，以及多種互操作形式進行特征的交叉組合，可以靈活的進行拼接，同時也利用了神經網絡對任意函數的擬合能力，按需增加復雜度或者減小復雜度。但是NeuralCF並沒有引入其他類型的特征，使得很多有價值的信息浪費。同時，互操作的選取也沒有給出更多說明，只有在實踐中進行探討了。

參考

免責聲明！

本站轉載的文章為個人學習借鑒使用，本站對版權不負任何法律責任。如果侵犯了您的隱私權益，請聯系本站郵箱yoyou2525@163.com刪除。

猜您在找 UDS診斷之0x11服務推薦系統（11）—— 多目標排序應用實踐_快手 android.content.res.Resources$NotFoundException: String resource ID #0x11 推薦系統實踐 0x0e LS-PLM Linux下串口編程遇到的接收數據錯誤及原因（0x0d,0x11接收錯誤） Spark推薦系統實踐推薦系統實踐 0x05 推薦數據集MovieLens及評測推薦系統實踐《推薦系統實踐》—— 讀后總結推薦系統實踐 0x0c FM系列(LR/FM/FFM)