花费 46 ms
Gensim LDA主题模型实验

本文利用gensim进行LDA主题模型实验,第一部分是基于前文的wiki语料,第二部分是基于Sogou新闻语料。 1. 基于wiki语料的LDA实验 上一文得到了wiki纯文本已分词语料 wiki ...

Wed Jul 06 02:18:00 CST 2016 6 33475
文本主题抽取:用gensim训练LDA模型

得知李航老师的《统计学习方法》出了第二版,我第一时间就买了。看了这本书的目录,非常高兴,好家伙,居然把主题模型都写了,还有pagerank。一路看到了马尔科夫蒙特卡罗方法和LDA主题模型这里,被打击到 ...

Sat May 18 00:07:00 CST 2019 2 8115
1. 文本相似度计算-文本向量化

1. 文本相似度计算-文本向量化 2. 文本相似度计算-距离的度量 3. 文本相似度计算-DSSM算法 4. 文本相似度计算-CNN-DSSM算法 1.前言 在自然语言处理过程中,经常会涉及 ...

Sun Oct 14 18:09:00 CST 2018 0 9633
NLP点滴——文本相似度

目录 前言 字面距离 common lang库 相同字符数 莱文斯坦距离(编辑距离) 定义 实现方式 ...

Tue Dec 06 18:50:00 CST 2016 6 16507
基于SIFT+Kmeans+LDA的图片分类器的实现

PS: 很久没做CV的事情了,这是很早以前刚入门时候的一篇,以后再有CV相关工作会发布在新的个人站点:http://my.phirobot.com/blog/category/cv.html CV分类 ...

Wed Apr 25 04:36:00 CST 2012 34 25795
自然语言处理--LDA主题聚类模型

LDA模型算法简介: 算法 的输入是一个文档的集合D={d1, d2, d3, ... , dn},同时还需要聚类的类别数量m;然后会算法会将每一篇文档 di 在 所有Topic上的一个 ...

Thu Aug 30 07:32:00 CST 2018 0 7369
特征提取(机器学习数据预处理)

特征提取(机器学习数据预处理) 特征提取与特征选择都是数据降维的技术,不过二者有着本质上的区别;特征选择能够保持数据的原始特征,最终得到的降维数据其实是原数据集的一个子集;而特征提取会通过数据 ...

Wed Sep 11 18:50:00 CST 2019 0 2014
LDA之主题模型原理解析与python实现

LDA(Latent dirichlet allocation)是有Blei于2003年提出的三层贝叶斯主题模型,通过无监督的学习方法发现文本中隐含的主题信息, 目的是要以无指导学习的方法从文本中发 ...

Mon Apr 02 03:45:00 CST 2018 0 4945
用贝叶斯判别分析再次预测股票涨跌情况

可以转载,禁止修改。转载请注明作者以及原文链接 注:本文是从贝叶斯分类器的角度来讨论判别分析,有关贝叶斯分类器的概念可参考文末延伸阅读第1-2篇文章。至于Fisher判别分析,未来会连同PC ...

Sat Jun 18 09:21:00 CST 2016 3 7898

 
粤ICP备18138465号  © 2018-2025 CODEPRJ.COM