花费 45 ms
倒排索引基础

一)单词-文档矩阵 通常检索的场景是:给定几个关键词,找出包含关键词的文档。 怎么快速找到包含某个关键词的文档就成为搜索的关键。这里我们借助单词-文档矩阵模型,通过这个模型我们可以很方便知道某篇文 ...

Thu Jul 19 00:03:00 CST 2012 1 4104
距离和相似度度量[转]

在数据分析和数据挖掘的过程中,我们经常需要知道个体间差异的大小,进而评价个体的相似性和类别。最常见的是数据分析中的相关分析,数据挖掘中的分类和聚类算法,如K最近邻(KNN)和K均值(K-Means)。 ...

Mon Aug 20 22:01:00 CST 2012 0 3681

 
粤ICP备18138465号  © 2018-2025 CODEPRJ.COM