前言 在信息检索领域常用的检索和索引算法有空间向量模型和隐语义模型。 传统向量空间模型 向量空间模型是信息检索领域最常用的检索方法,其检索过程是,将文档集D中的所有文档和查询都表示成以单词为特征的向量,特征值为每个单词的TF-IDF值,然后使用向量空间模型(即计算查询Q的向量和每个文档的之间 ...
文本挖掘的两个方面应用: 分类: a.将词汇表中的字词按意思归类 比如将各种体育运动的名称都归成一类 b.将文本按主题归类 比如将所有介绍足球的新闻归到体育类 检索:用户提出提问式 通常由若干个反映文本主题的词汇组成 ,然后系统在数据库中进行提问式和预存的文本关键词的自动匹配工作,两者相符的文本被检出。 文本分类中出现的问题: 一词多义 比如bank 这个单词如果和mortgage, loans ...
2015-11-13 02:25 0 2617 推荐指数:
前言 在信息检索领域常用的检索和索引算法有空间向量模型和隐语义模型。 传统向量空间模型 向量空间模型是信息检索领域最常用的检索方法,其检索过程是,将文档集D中的所有文档和查询都表示成以单词为特征的向量,特征值为每个单词的TF-IDF值,然后使用向量空间模型(即计算查询Q的向量和每个文档的之间 ...
基本定义 一种寻路算法,特点是:启发式的,效率高,基本思路比较简单。 用途 寻路。在指定的地图上,考虑到地图上的移动代价,找到最优的路径。 核心概念 开表,闭表,估值函数。 开表 开表,记录了当前需要处理的地图上的点。 1什么点会加入开表? 1.1 当一个点是起始点时 ...
最近做压缩算法. 用到了deflate压缩算法, 找了很多资料, 这篇文章算是讲的比较易懂的, 这篇文章不长,但却浅显易懂, 基本上涵盖了我想要知道的所有要点. 翻译出来, 留存. 可能对正在学习或者准备学习deflate算法的童鞋有所帮助. 先说一下deflate算法 ...
学习FPGA时,对于乘法的运算,尤其是对于有符号的乘法运算,也许最熟悉不过的就是 BOOTH算法了。 这里讲解一下BOOTH算法的计算过程,方便大家对BOOTH的理解。 上图是BOOTH算法的数学表达。由于FPGA擅长进行并行移位计算,所以BOOTH算法倒也好实现 ...
本文地址为:http://www.cnblogs.com/kemaswill/,作者联系方式为kemaswill@163.com,转载请注明出处。 1. 传统向量空间模型的缺陷 向量空间模 ...
1 传统的位式控制算法 用户期望值Sv(设定值)经控制算法输出一个输出信号OUT,输出信号加载到执行部件上(像MOS管等)对控制对象进行控制(步进电机、加热器等),控制对象的当前值(Pv)如速度通过传感器反馈给控制算法与Sv相比较。 特点:1 位式算法输出的控制信号只有两种状态‘H ...
一.什么是贪心算法? 贪心算法又称之为贪婪算法,在考虑问题时,总是做出在当前状况来说最好的算则,而不从整理来考虑。从某种意义上说是局部最优解,贪心算法所得到的答案并不一定是整体最优解,所以在使用贪心算法一定要考虑清楚,是否能使用贪心算法。 选择的贪心策略必须具有无后效性,即当前 ...
什么是Hash Hash算法,简称散列算法,也成哈希算法(英译),是将一个大文件映射成一个小串字符。与指纹一样,就是以较短的信息来保证文件的唯一性的标志,这种标志与文件的每一个字节都相关,而且难以找到逆向规律。 举个列子: 服务器存了10个文本文件 ...