花费 42 ms
Learning to Rank之Ranking SVM 简介

排序一直是信息检索的核心问题之一,Learning to Rank(简称LTR)用机器学习的思想来解决排序问题(关于Learning to Rank的简介请见我的博文Learning to Rank简介)。LTR有三种主要的方法:PointWise,PairWise,ListWise ...

Wed Aug 07 05:14:00 CST 2013 4 26790
Learning to Rank 简介

去年实习时,因为项目需要,接触了一下Learning to Rank(以下简称L2R),感觉很有意思,也有很大的应用价值。L2R将机器学习的技术很好的应用到了排序中,并提出了一些新的理论和算法,不 ...

Sun Jun 02 00:09:00 CST 2013 3 27370
[LTR] 信息检索评价指标(RP/MAP/DCG/NDCG/RR/ERR)

一、RP R(recall)表示召回率、查全率,指查询返回结果中相关文档占所有相关文档的比例;P(precision)表示准确率、精度,指查询返回结果中相关文档占所有查询结果文档的比例; ...

Fri Mar 30 07:37:00 CST 2018 1 6367
Latent Semantic Analysis(LSA/ LSI)算法简介

本文地址为:http://www.cnblogs.com/kemaswill/,作者联系方式为kemaswill@163.com,转载请注明出处。 1. 传统向量空间模型的缺陷 向量空间模型是信息检索中最常用的检索方法,其检索过程是,将文档集D中的所有文档和查询都表示成以单词为特征 ...

Thu Apr 18 06:50:00 CST 2013 0 16762
使用haystack实现django全文检索搜索引擎功能

前言 django是python语言的一个web框架,功能强大。配合一些插件可为web网站很方便地添加搜索功能。 搜索引擎使用whoosh,是一个纯python实现的全文搜索引擎,小巧简单。 中 ...

Sat Aug 26 22:17:00 CST 2017 0 5299
Learning to Rank之RankNet算法简介

排序一直是信息检索的核心问题之一, Learning to Rank(简称LTR)用机器学习的思想来解决排序问题(关于Learning to Rank的简介请见我的博文Learning to Rank简介)。LTR有三种主要的方法:PointWise,PairWise,ListWise. ...

Thu Aug 15 02:46:00 CST 2013 1 10666
信息检索技术——向量空间模型

上次介绍了信息检索技术——布尔检索,布尔模型已经可以解决一个很重要的问题,就是找到和用户需求相关的文档(其中还需要很多处理,比如分词,归一化,去掉停用词等等,我们只是介绍主要的框架流程)。但是这样找到的文档会有很多,也许上千个,也许上万个,这远远不是用户所要的。用户也不会去从几万个文档中挑选 ...

Wed Mar 28 17:49:00 CST 2012 3 11293
关于针对本校教务系统漏洞的一次信息检索

因为很久以前看了一篇别人对教务系统进行信息检索的实例,我也想查看一下我们校区的教务系统到底有多安全。但是在实际写脚本时候,却遇到了很多问题,本篇博客也将是一篇技术总结。 一、前期准备 思路是一个一个学号的去试是否使用了默认密码,我了解到16级的教务系统默认密码是随机码,18级的教务系统默认 ...

Wed Jan 16 17:41:00 CST 2019 3 1461
IR的评价指标-MAP,NDCG和MRR

IR的评价指标-MAP,NDCG和MRR MAP(Mean Average Precision): 单个主题的平均准确率是每篇相关文档检索出后的准确率的平均值。主集合 ...

Mon Jan 18 19:48:00 CST 2016 1 3975
搜索引擎:该如何设计你的倒排索引?

搜索引擎如何工作? 信息检索已经发展的非常成熟了,应该所有人都不陌生。我有幸这几年接触过并且实际做过一些搜索引擎开发的工作,特此总结并分享给大家。实际上,一个成熟的搜索引擎是想当复杂的,比如百度的,就分nginx,vui,us,as,bs,da.....等等这些模块,当然这些简写的字母 ...

Thu Jan 18 18:08:00 CST 2018 1 2077

 
粤ICP备18138465号  © 2018-2025 CODEPRJ.COM