原文:局部敏感哈希算法

这篇文章介绍了局部敏感哈希算法,局部敏感哈希是非监督的哈希算法。算法的输入是实数域的特征向量,输出为一个binary vector。利用哈希函数将数据点映射到不同的桶中是一种保形映射,使得数据点i和数据点j在原始空间的相似度s与映射后的在同一个桶的概率呈现正相关。之所以这么做,主要是避免exhausted search. 如果理想状态,每个桶中的元素数目大致相同,那么查询时的运算量将从原来的数据样 ...

2016-08-09 22:42 0 1928 推荐指数:

查看详情

浅析常用局部敏感哈希算法

  上一年记录的东西,整理下...   需要代码联系我QQ:791909235,本人不做义务咨询。 一.哈希检索概述   LSH是Locality Sensitive Hashing的缩写,也翻译为局部敏感哈希,是一种通过设计满足特殊性质即局部敏感哈希函数,提高相似查询效率的方法 ...

Thu Jul 09 00:24:00 CST 2015 2 7594
基于局部敏感哈希的协同过滤算法之simHash算法

  搜集了快一个月的资料,虽然不完全懂,但还是先慢慢写着吧,说不定就有思路了呢。   开源的最大好处是会让作者对脏乱臭的代码有羞耻感。   当一个做推荐系统的部门开始重视【数据清理,数据标柱,效果 ...

Sun Apr 26 05:44:00 CST 2015 4 7224
[Algorithm] 局部敏感哈希算法(Locality Sensitive Hashing)

  局部敏感哈希(Locality Sensitive Hashing,LSH)算法是我在前一段时间找工作时接触到的一种衡量文本相似度的算法局部敏感哈希是近似最近邻搜索算法中最流行的一种,它有坚实的理论依据并且在高维数据空间中表现优异。它的主要作用就是从海量的数据中挖掘出相似的数据,可以具体 ...

Tue Nov 10 23:57:00 CST 2015 5 20351
基于局部敏感哈希的协同过滤推荐算法之E^2LSH

一.算法实现   基于p-stable分布,并以‘哈希技术分类’中的分层法为使用方法,就产生了E2LSH算法。   E2LSH中的哈希函数定义如下:   其中,v为d维原始数据,a为随机变量,由正态分布产生; w为宽度值,因为a∙v+b得到的是一个实数 ...

Wed May 06 18:03:00 CST 2015 0 2088
局部敏感哈希(LSH)之simhash和minhash

minhash simhash SimHash的工作原理 SimHash算法工作流程图: 1、分词,把需要判断文本分词形成这个文章的特征单词。最后形成去掉噪音词的单词序列并为每个词加上权重,我们假设 ...

Wed Mar 27 23:17:00 CST 2019 0 572
局部敏感哈希源代码-python

之前在研究lsh算法,糊里糊涂的,但是该算法的高速性能让我还是得把他搞懂。 借鉴之前阅读的各个大佬博客,从相思能推荐的角度完善了一版代码,花了两天时间才调试出来,看看以后能不能用得上。大家有需求的可以直接使用了,福利满满。嘎嘎嘎 功能:已知一个样本的二进制特征向量,从特征中心中找出特征相似 ...

Thu Mar 26 03:21:00 CST 2020 0 986
 
粤ICP备18138465号  © 2018-2025 CODEPRJ.COM