BTM模型
與 LDA 假設不同,BTM 模型假設每個biterm 中的兩個詞匯均是采樣於一個主題 z,而每個主題是關於詞匯的多項式分布。該模型示意圖如下 BTM 於LDA的不同在於,LDA是document-level,BTM是corpus-level,LDA 計算 ...
記錄學習BTM 來源知乎等https: zhuanlan.zhihu.com p 什么是BTM BTM和LDA一樣都是主題模型,就是給你一篇文檔,你指定一個主題的個數,這兩個模型都會生成每個主題中的關鍵詞,以及一篇新的文檔中各個主題的概率有多大。根據論文作者的表述。傳統的主題模型 LDA 在處理短文本 比如直播間彈幕,微博文本等等 ,會因為文本中的詞過於稀疏,得到模型的效果不夠好。為了解決這個問 ...
2021-03-25 16:11 0 674 推薦指數:
與 LDA 假設不同,BTM 模型假設每個biterm 中的兩個詞匯均是采樣於一個主題 z,而每個主題是關於詞匯的多項式分布。該模型示意圖如下 BTM 於LDA的不同在於,LDA是document-level,BTM是corpus-level,LDA 計算 ...
BTM的原理跟LDA很像,下面是該模型的概率圖: 由該圖可以看出來,與LDA的區別在於確定主題分布和詞分布后相應地取兩個詞(而LDA只取一個,即類比常見的骰子說法:先投擲K面的骰子得到主題z,再根據相應的V面骰子,連續投擲兩次,得到一對詞匯),這倆詞叫做biterm(就是在把一個文檔分詞之后 ...