1.一篇關於LDA原理的文章
http://blog.csdn.net/v_july_v/article/details/41209515?utm_source=tuicool&utm_medium=referral
2.一堆工具包
http://mengjunxie.github.io/ae-lda/topic-modeling.html
3.其中c++工具包 http://gibbslda.sourceforge.net/
需要在linux系統上運行
GibbsLDA ++,
4.其中python的使用教程
gensim http://radimrehurek.com/gensim/index.html
中文版使用教程 http://blog.csdn.net/a1368783069/article/details/52088302
目前,暫時選擇使用gensim
使用gensim
1.下載gensim,安裝,https://pypi.python.org/pypi/gensim,選擇的是gensim-1.0.1.win32-py2.7.exe (md5)版本
2.import gensim出現錯誤 No module named smart_open
解決辦法:安裝smart_open,https://pypi.python.org/pypi/smart_open,
使用命令 pip install smart_open-1.5.1.tar.gz
3.出現warning,855
UserWarning: detected Windows; aliasing chunkize to chunkize_serial
warnings.warn("detected Windows; aliasing chunkize to chunkize_serial")
解決辦法:
在導入gensim 之前,可以使用此代碼抑制消息:
import warnings warnings.filterwarnings(action='ignore', category=UserWarning, module='gensim') import gensim