判別式模型與生成式模型

本文轉載自查看原文 2019-08-28 11:38 428 機器學習

判別式模型（Discriminative Model）是直接對條件概率p(y|x;θ)建模。常見的判別式模型有線性回歸模型、線性判別分析、支持向量機SVM、神經網絡等。

生成式模型（Generative Model）則會對x和y的聯合分布p(x,y)建模，然后通過貝葉斯公式來求得p(y_i|x)，然后選取使得p(y_i|x)最大的y_i

常見生成式模型:

混合高斯模型，估計了不同輸入和類別的聯合分布。

朴素貝葉斯，模型訓練時采用聯合概率分布積。

隱馬爾科夫模型，建立了狀態序列和觀察序列的聯合分布。

貝葉斯網絡，概率圖模型中的有向圖網絡，對聯合分布建模，由各自局部條件概率分布相乘。

馬爾科夫隨機場，概率圖模型中無向圖網絡，同樣對聯合分布建模，分解為極大團上勢函數的乘積。

常見判別式模型:

條件隨機場，在觀測序列上對目標序列進行建模。

線性回歸，在X的條件下Y的分布。

邏輯回歸，在x的條件下兩個分類的概率。

支持向量機，它的訓練過程是在學習分類邊界。

傳統神經網絡，同樣是學習分類邊界。

一個通俗的例子：

說是大飛哥要玩擲飛鏢的游戲，飛鏢偏離靶心的偏離其實是不確定的，所以適合用概率模型來描述。概率就是衡量可能性的指標。飛鏢偏離靶心小於1厘米的概率，和風速，標靶距離都有關系。假定標靶距離可以是10到20米，風速可以是1米/秒到10米/秒，我們可以把每個距離下，每個風速情況下的偏離小於1厘米的概率，大於1厘米的概率整理成一個表格，就是距離與風速的聯合概率分布。如下表所示：

所謂條件概率，即有條件的聯合概率，比如，如果風速確定為1不變，那么偏離小於1厘米的概率就只和距離有關系了。如距離為10時，概率為99%和1%。這就是條件概率（風速是條件）

生成式特點:

對聯合概率建模，學習所有分類數據的分布。

學習到的數據本身信息更多，能反應數據本身特性。

學習成本較高，需要更多的計算資源。需要的樣本數更多，樣本較少時學習效果較差。

推斷時性能較差。

一定條件下能轉換成判別式。

判別式特點:

對條件概率建模，學習不同類別之間最優邊界。

捕捉不同類別特征的差異信息，不學習本身分布信息，無法反應數據本身特性。

學習成本較低，需要的計算資源較少。

需要的樣本數可以較少，少樣本也能很好學習。

預測時擁有較好性能。無法轉換成生成式。

免責聲明！

本站轉載的文章為個人學習借鑒使用，本站對版權不負任何法律責任。如果侵犯了您的隱私權益，請聯系本站郵箱yoyou2525@163.com刪除。

猜您在找 判別式模型與生成式模型的區別判別式模型與生成式模型的區別常見生成式模型與判別式模型常見生成式模型與判別式模型生成式模型和判別式模型判別式模型 vs. 生成式模型判別式模型與生成式模型判別式模型和生成式模型機器學習--判別式模型與生成式模型機器學習之判別式模型和生成式模型