loglikelihood ratio 相似度

本文轉載自查看原文 2016-10-10 18:54 1691 機器學習/ 推薦系統/ loglikelihood ratio

摘要：

　　在機器學習中常用到各種距離或者相似度，今天在看美團推薦系統重排序的文章時看到了loglikelihood ratio 相似度,特總結起來。以后有時間再把常用的相似度或者距離梳理到一篇文章。

背景：

　　記錄loglikelihood ratio 相似度概念

總結：

　　在mahout中，loglikelihood ratio也作為一種相似度計算方法被采用。

　　下表表示了Event A和Event B之間的相互關系，其中：

　　k11 ：Event A和Event B共現的次數
　　k12 ：Event A發生，Event B未發生的次數
　　k21 ：Event B發生，Event A未發生的次數
　　k22 ：Event A和Event B都不發生的次數

　　則logLikelihoodRatio=2 * (matrixEntropy - rowEntropy - columnEntropy)

　　其中

　　rowEntropy = entropy(k11, k12) + entropy(k21, k22)
　　columnEntropy = entropy(k11, k21) + entropy(k12, k22)
　　matrixEntropy = entropy(k11, k12, k21, k22)

　　(entropy為幾個元素組成的系統的香農熵)

　　下面舉一個實際的例子：

我以一個實際的例子來介紹一下其中的計算過程：假設有商品全集I=｛a,b,c,d,e,f｝，其中A用戶偏好商品{a,b,c}，B用戶偏好商品{b,d}，那么有如下矩陣：

此外我們還定義以下變量

計算步驟如下：

計算行熵
注：代碼中
計算列熵
計算矩陣熵

注意：以上熵的計算均沒有加負號，后面會講到原因
計算相似度
$U s e r S i m i l a r i t y = 2 * (m a t r i x E n t r o p y - r o w E n t r o p y - c o l u$
實現代碼：https://github.com/Tongzhenguo/Java-codes/blob/master/src/main/java/data/code/similarity/logLikelihoodRatio.java

參考鏈接：

　　　　http://www.csdn.net/article/2015-01-30/2823783

　　　　http://blog.csdn.net/u014374284/article/details/49823557

免責聲明！

本站轉載的文章為個人學習借鑒使用，本站對版權不負任何法律責任。如果侵犯了您的隱私權益，請聯系本站郵箱yoyou2525@163.com刪除。

猜您在找 余弦相似度計算圖像相似度計算各種距離和相似度總結語義相似度(實踐篇) Levenshtein計算相似度距離矩陣匹配及相似度計算文本相似度算法 KL散度，相似度計算以及相似度重要性句子相似度計算方法 BERT在語義相似度計算中的應用（一）