1. 前言

之前介紹了DSSM算法，它主要是用了DNN的結構來對數據進行降維度，本文用CNN的結構對數據進行降維。

2. CNN-DSSM

CNN-DSSM在DSSM的基礎上改進了數據的預處理和深度

CNN-DSSM的架構圖如下：

輸入：\(Query\)是代表用戶輸入，\(document\)是數據庫中的文檔。

獲得128維的語義后就可以計算文本之間的相似度了，計算相似度的過程和DNN-DSSM的過程是一樣的。可以發現CNN-DSSM和DNN-DSSM基本流程是差不多的，就是用卷積和池化的操作代替了DNN的操作。

CNN-DSSM的結構可分為數據預處理（把文本向量化），在經過深度神經網絡，壓縮矩陣，最后拿壓縮后的矩陣進行相似度計算。和DNN-DSSM相比主要的變化在深度神經網絡這一層的處理方式，舉一反三那肯定也還有通過RNN來處理數據的過程，RNN-DSSM后面會載講解。

本站轉載的文章為個人學習借鑒使用，本站對版權不負任何法律責任。如果侵犯了您的隱私權益，請聯系本站郵箱yoyou2525@163.com刪除。

猜您在找 DSSM算法-計算文本相似度 3. 文本相似度計算-DSSM算法常見文本相似度計算法使用余弦相似度算法計算文本相似度文本相似度算法文本相似度計算/文本比較算法利用simhash計算文本相似度計算文本相似度方法總結（一）短文本相似度計算計算文本相似度方法總結（二）