花费 33 ms
TF-IDF及其算法

概念 TF-IDF(term frequency–inverse document frequency)是一种用于资讯检索与资讯探勘的常用加权技术。TF-IDF是一种统计方法,用以评估一字词对于一个文件集或一个语料库中的其中一份文件的重要程度。字词的重要性随着它在文件中出现的次数 ...

Tue Jul 17 23:03:00 CST 2012 8 78899
深入研究Visual studio 2017 RC新特性

在【Xamarin+Prism开发详解三:Visual studio 2017 RC初体验】中分享了Visual studio 2017RC的大致情况,同时也发现大家对新的Visual Studio很 ...

Sun Dec 04 05:49:00 CST 2016 20 16986
搜索引擎(1)—— 概述与功能架构

1 背景 做搜索引擎有有2年时间了,算是有个基本的入门。决定写一个系列博客,记录下自己所认识的搜索引擎,也希望对新入行的朋友有些帮助。 2 概述 搜索与推荐 互联网上有海量的信息,从互联网上获 ...

Mon Nov 25 06:46:00 CST 2019 0 744
solr+jieba结巴分词

为什么选择结巴分词 分词效率高 词料库构建时使用的是jieba (python) 结巴分词Java版本 下载 编译 注意 solr ...

Fri Feb 02 20:40:00 CST 2018 2 1534
Elasticsearch 检索

说到查询,那么索引也是一个绕不开的话题,可以说,没有索引就没有检索,先来看一个示意图 左边是索引过程,右边是检索过程。关键的步骤是分词过程,我用等号表示这两个过程一样,而且,必须一样,这个等号并不是模糊的流程的相同,而且必须是逻辑也相同。 简单来讲,采用的分词器和分词流程 ...

Sat Nov 26 21:29:00 CST 2016 0 2390
如何高效地存储与检索大规模的图谱数据?

摘要:本文简要介绍知识图谱的存储与检索相关的知识。 本文分享自华为云社区《知识图谱的存储与检索》,原文作者:JuTzungKuei 。 1、概述 背景:随着互联网的发展与普及,一个万物互联的世界正在成型。与此同时,数据呈现出爆炸式的指数级增长,我们正处于一个数字洪流汹涌澎湃的新时代 ...

Wed May 12 18:55:00 CST 2021 7 851

 
粤ICP备18138465号  © 2018-2025 CODEPRJ.COM