gensim LDA模型提取每篇文檔所屬主題（概率最大主題所在）

本文轉載自查看原文 2018-11-19 15:53 2263

gensim的LDA算法中很容易提取到每篇文章的主題分布矩陣，但是一般地還需要進一步獲取每篇文章歸屬到哪個主題概率最大的數據，這個在檢索gensim文檔和網絡有關文章后，發現竟然沒有。

簡單寫了一下。

#打印每篇文檔最高概率主題
for i in lda.get_document_topics(corpus)[:]:
　　listj=[]
　　for j in i:
　　　　listj.append(j[1])
　　bz=listj.index(max(listj))

　　#print(i[bz][0],i,listj,listj.index(max(listj)))
　　print(i[bz][0])

免責聲明！

本站轉載的文章為個人學習借鑒使用，本站對版權不負任何法律責任。如果侵犯了您的隱私權益，請聯系本站郵箱yoyou2525@163.com刪除。

猜您在找 Gensim LDA主題模型實驗文檔主題生成模型（LDA）初試主題模型LDA-基於python的gensim包主題模型TopicModel：主題模型LDA的應用通俗理解LDA主題模型主題模型LDA：從入門到放棄文本主題模型之LDA(二) LDA求解之Gibbs采樣算法用scikit-learn學習LDA主題模型 [NLP]LDA主題模型的python實現 LDA主題模型講解及代碼Python實現