gensim LDA模型提取每篇文档所属主题(概率最大主题所在)


gensim的LDA算法中很容易提取到每篇文章的主题分布矩阵,但是一般地还需要进一步获取每篇文章归属到哪个主题概率最大的数据,这个在检索gensim文档和网络有关文章后,发现竟然没有。

简单写了一下。

#打印每篇文档最高概率主题
for i in lda.get_document_topics(corpus)[:]:
  listj=[]
  for j in i:
    listj.append(j[1])
  bz=listj.index(max(listj))

  #print(i[bz][0],i,listj,listj.index(max(listj)))
  print(i[bz][0])

 


免责声明!

本站转载的文章为个人学习借鉴使用,本站对版权不负任何法律责任。如果侵犯了您的隐私权益,请联系本站邮箱yoyou2525@163.com删除。



 
粤ICP备18138465号  © 2018-2025 CODEPRJ.COM