關於話題模型(topic model)的一些思考


最近在分析知乎的‘問題’文本所屬的話題,用python提取,實現了LSTM和LDA模型在這個方面的應用,但是效果不是很理想,一個是這些文本屬於短文本,另外用來分析的文本本身包含多個領域的問題,並且數量較少,很有可能只有幾條。所以最后得到的話題模型即使分了很多主題仍然在同一個主題會出現多種詞匯。

嘗試尋找短文本分析話題模型有優勢的算法。。。。。。。。。。未完待續


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM