LDA工具的來源


1.一篇關於LDA原理的文章

http://blog.csdn.net/v_july_v/article/details/41209515?utm_source=tuicool&utm_medium=referral

 

2.一堆工具包

http://mengjunxie.github.io/ae-lda/topic-modeling.html

 

3.其中c++工具包 http://gibbslda.sourceforge.net/

使用教程 http://weblab.com.cityu.edu.hk/blog/luheng/2011/06/24/%E7%94%A8gibbslda%E5%81%9Atopic-modeling/#comment-87

需要在linux系統上運行

GibbsLDA ++,

 

4.其中python的使用教程 

gensim http://radimrehurek.com/gensim/index.html

中文版使用教程 http://blog.csdn.net/a1368783069/article/details/52088302

 

目前,暫時選擇使用gensim

 

 


使用gensim

1.下載gensim,安裝,https://pypi.python.org/pypi/gensim,選擇的是gensim-1.0.1.win32-py2.7.exe (md5)版本

2.import gensim出現錯誤 No module named smart_open

解決辦法:安裝smart_open,https://pypi.python.org/pypi/smart_open,

使用命令 pip install smart_open-1.5.1.tar.gz

3.出現warning,855

UserWarning: detected Windows; aliasing chunkize to chunkize_serial
warnings.warn("detected Windows; aliasing chunkize to chunkize_serial")

解決辦法:

導入gensim 之前,可以使用此代碼抑制消息

import warnings warnings.filterwarnings(action='ignore', category=UserWarning, module='gensim') import gensim

 


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM