原文:《統計學習方法》筆記--概率潛在語義分析

概率潛在語義分析 probabilistic latent semantic analysis,PLSA 是一種利用概率生成模型對文本集合進行話題分析的無監督學習方法。 跟潛在語義分析相似,而其特點是基於概率模型,用隱變量表示話題 整個模型表示文本生成話題,話題生成單詞,從而得到單詞 文本共現數據的過程。 概率潛在語義分析模型有生成模型,以及等價的共現模型。 假定n個文本的集合,文本中所有單詞的集 ...

2020-03-24 22:18 0 852 推薦指數:

查看詳情

統計學習方法學習筆記

上學期花了一個多月讀完了李航老師的《統計學習方法》,現在帶着新入團隊的新同學以讀書會的形式讀這本書,書里邊全是干貨,對於我理解基本的機器學習算法很有幫助,也筆頭做了一些總結(不完全基於此書),現將其摘錄於此作為在博客園的第一篇博客。因為並不是為了掃盲,所以僅僅是抓出脈絡以及關鍵點,方便以后快速溫習 ...

Fri Jun 12 20:26:00 CST 2015 0 4620
統計學習方法筆記 -- 概論

統計學習方法是基於訓練數據構建統計模型,從而對數據進行預測和分析統計學習分為,監督學習(supervised learning),非監督學習,半監督學習和強化學習(reinforcement learning),其中以監督學習最為常見和重要,所以這里只討論監督學習 統計學習的過程如下, 1. ...

Sat Mar 15 02:25:00 CST 2014 3 2076
潛在語義分析LSA

潛在語義分析通過矢量語義空間來分析文檔和詞的關系。 基本假設:如果兩個詞多次出現在同個文檔中,則兩個詞在語義上具有相似性。 LSA使用大量文本構成矩陣,每行表示一個詞,一列表示一個文檔,矩陣元素可以是詞頻或TF-IDF,然后使奇異值分解SVD進行矩陣降維,得到原矩陣的近似,此時兩個詞的相似性 ...

Thu Nov 12 20:19:00 CST 2015 0 2368
統計學習方法(一)

統計學習 統計學習是關於計算機基於數據構建概率統計模型並運用模型對數據進行預測與分析的一門學科。統計學習也稱為統計機器學習(statical machine learning)。 統計學習方法是基於數據構建統計模型從而對數據進行預測和分析統計學習由監督學習、非監督學習、半監督學習和強化學習 ...

Sun May 10 07:18:00 CST 2015 0 3052
李航-統計學習方法-筆記-8:提升方法

提升方法 簡述:提升方法(boosting)是一種常用的統計學習方法,應用廣泛且有效。在分類問題中,它通過改變訓練樣本的權重,學習多個分類器,並將這些分類器進行線性組合,提高分類的性能。 本章 (1)介紹boosting方法的思路和代表性的boosting算法AdaBoost (2)通過訓練 ...

Wed Jun 05 23:54:00 CST 2019 0 678
李航-統計學習方法-筆記-3:KNN

KNN算法 基本模型:給定一個訓練數據集,對新的輸入實例,在訓練數據集中找到與該實例最鄰近的k個實例。這k個實例的多數屬於某個類,就把輸入實例分為這個類。 KNN沒有顯式的學習過程。 KNN使用的模型實際上對應於特征空間的划分。特征空間中,對每個訓練實例點\(x_i\),距離該點比其它點更近 ...

Wed Jun 05 23:11:00 CST 2019 0 535
統計學習方法筆記——一、統計學習(機器學習)基礎知識(上)

1.1 統計學習 統計學習也稱統計機器學習 主要特點: 以計算機及網絡為平台,建立在計算機及網絡之上 以數據為研究對象,是數據驅動的學科 統計學習的目的是對數據進行預測和分析 統計學習方法為中心,統計學習方法構建模型並應用模型進行預測和分析 統計學習概率論、統計學 ...

Tue Feb 26 04:24:00 CST 2019 0 798
統計學習方法——朴素貝葉斯法、先驗概率、后驗概率

  朴素貝葉斯法,就是使用貝葉斯公式的學習方法,朴素就是它假設輸入變量(向量)的各個分量之間是相互獨立的。所以對於分量之間不獨立的分布,如果使用它學習和預測效果就不會很好。 簡化策略   它是目標是通過訓練數據集學習聯合概率分布$P(X, Y)$用來預測。書上說,具體是先學習到先驗概率 ...

Sat Jan 25 23:03:00 CST 2020 0 1294
 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM