花費 69 ms
本人常用資源整理(ing...)

Deep Learning(深度學習): ufldl的2個教程(這個沒得說,入門絕對的好教程,Ng的,邏輯清晰有練習):一 ufldl的2個教程(這個沒得說,入門絕對的好教程,Ng的,邏輯清 ...

Thu May 24 16:32:00 CST 2012 24 43099
TF-IDF理解及其Java實現

TF-IDF 前言 前段時間,又具體看了自己以前整理的TF-IDF,這里把它發布在博客上,知識就是需要不斷的重復的,否則就感覺生疏了。 TF-IDF理解 TF-IDF(term frequen ...

Mon Aug 26 23:20:00 CST 2013 10 25702
徹底弄懂LSH之simHash算法

  馬克·吐溫曾經說過,所謂經典小說,就是指很多人希望讀過,但很少人真正花時間去讀的小說。這種說法同樣適用於“經典”的計算機書籍。   最近一直在看LSH,不過由於matlab基礎比較差,一直沒搞懂 ...

Thu May 21 08:03:00 CST 2015 0 19824
PLSA及EM算法

前言:本文主要介紹PLSA及EM算法,首先給出LSA(隱性語義分析)的早期方法SVD,然后引入基於概率的PLSA模型,其參數學習采用EM算法。接着我們分析如何運用EM算法估計一個簡單的mixture ...

Tue Feb 18 00:43:00 CST 2014 1 10527
淺析常用局部敏感哈希算法

  上一年記錄的東西,整理下...   需要代碼聯系我QQ:791909235,本人不做義務咨詢。 一.哈希檢索概述   LSH是Locality Sensitive Hashing的縮寫,也翻 ...

Thu Jul 09 00:24:00 CST 2015 2 7594
基於局部敏感哈希的協同過濾算法之simHash算法

  搜集了快一個月的資料,雖然不完全懂,但還是先慢慢寫着吧,說不定就有思路了呢。   開源的最大好處是會讓作者對臟亂臭的代碼有羞恥感。   當一個做推薦系統的部門開始重視【數據清理,數據標柱,效果 ...

Sun Apr 26 05:44:00 CST 2015 4 7224
IR的評價指標-MAP,NDCG和MRR

MAP(Mean Average Precision): 單個主題的平均准確率是每篇相關文檔檢索出后的准確率的平均值。主集合的平均准確率(MAP)是每個主題的平均准確率的平均值。MAP 是反映系統在 ...

Fri Aug 16 23:21:00 CST 2013 0 10199
評估指標:准確率(Precision)、召回率(Recall)以及F值(F-Measure)

為了能夠更好的評價IR系統的性能,IR有一套完整的評價體系,通過評價體系可以了解不同信息系統的優劣,不同檢索模型的特點,不同因素對信息檢索的影響,從而對信息檢索進一步優化。 由於IR的目標是在較短時 ...

Sun Jun 28 22:51:00 CST 2015 0 6361
距離公式

距離本意就是兩個目標的某一特征集從一個變成另一個需要的最小操作。廣泛使用於相似度比較領域。機器學習中經常用的距離有: 1. 歐氏距離 ( Euclidean Distances) 2. 曼哈頓距離 ...

Tue Dec 31 00:41:00 CST 2013 0 7826
memory-based 協同過濾(CF)方法

協同過濾(collaborative filtering,CF)算法主要分為memory-based CF 和 model-based CF,而memory-based CF 包括user-based ...

Wed Feb 12 19:05:00 CST 2014 0 5866

 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM