http://cucmakeit.github.io/2014/11/13/%E4%BF%AE%E6%AD%A3%E4%BD%99%E5%BC%A6%E7%9B%B8%E4%BC%BC%E5%BA%A6%E4%B8%8E%E7%9A%AE%E5%B0%94%E6%A3%AE%E7%9B%B8%E5%85%B3%E7%B3%BB%E6%95%B0/
最后一段總結精辟:
需要注意的一點是修正的余弦相似度與皮爾森相關系數之間的細微差別。我之前也一直以為兩個公式一樣,只是意義上不同,但是仔細觀察可以看到兩者的分母是不同的:
修正余弦相似度的分母中計算的是每個用戶自己有過評分的所有項目;
皮爾森相關系數的分母中計算的是兩個用戶共同評過分的項目。
兩個公式的分子是相同的,需要針對兩個用戶共同評過分的項目,分別減去該用戶的平均評分來得到相對分數。而每個用戶的平均評分分別由每個用戶自己所有評過分的項目計算得到。
