Stanford機器學習筆記-2.Logistic Regression

本文轉載自查看原文 2016-03-28 19:25 4665 Machine Learning

Content:

2 Logistic Regression.

　　2.1 Classification.

　　2.2 Hypothesis representation.

　　　　2.2.1 Interpreting hypothesis output.

　　2.3 Decision boundary.

　　　　2.3.1 Non-linear decision boundaries.

　　2.4 Cost function for logistic regression.

　　　　2.4.1 A convex logistic regression cost function.

　　2.5 Simplified cost function and gradient descent.

　　　　2.5.1 Probabilistic interpretation for cost function.

　　　　2.5.2 Gradient Descent for logistic regression.

　　2.6 Multiclass classification problem

key words: logistic regression, classification, decision boundary, convex function, One-vs-all

2.6 Multiclass classification problem

現實中也常遇到多分類問題(multiclass classification problem)，如判斷手寫的數字是0~9中的哪一個就是一個有10類的問題。多分類學習的基本思路是“拆解法”，即將多分類任務拆為若干個二分類任務求解。具體來說，先對問題進行拆分，然后為拆分出的每個二分類任務訓練一個分類器（也就是h(x)）；在預測時，對這些分類器的預測結果進行集成。

下面介紹一個常用的拆分策略-“One-vs-all”.

One-vs-all每次將一個類的樣例作為正例(“1”)，所有其他類作為反例(“0”)來訓練n個分類器。在預測時，有兩種情況看

情況1：若僅有一個分類器預測為正例，則對應的類別標記作為最終分類結果；
情況2：若有多個分類器預測為正例，則選擇分類器的預測置信度最大的類別標記為分類結果，也就是。

例如對於圖2-10所示的多分類問題，我們先將三角形，正方形，叉分別標記為類別1，2，3，然后做如下划分：

先將三角形看作正例“1”，正方形和叉看作反例“0”，訓練出h_θ¹(x)
再將正方形看作正例“1”，三角形和叉看作反例“0”，訓練出h_θ²(x)
最后將叉看作正例“1”，三角形和正方形看作反例“0”，訓練出h_θ³(x)

預測時每一個預測值都是一個形如[h_θ¹(x), h_θ²(x), h_θ³(x)]的向量。選出最大的h(x)，它的上標就是對應的類別標記。例如若預測值為[0.13, 0.24, 0.79]，對應的就是上文所說的情況1，即只有h_θ³(x) > 0.5表現為正例，所以應該認為是屬於3標記類，即為叉。若預測值為[0.12, 0.83, 0.56], 對應的就是上文所說的情況2，h_θ²(x) 和h_θ³(x)都大於0.5，都預測為正例，但h_θ²(x)> h_θ³(x)，所以應該預測是屬於2標記類，即為正方形。

圖2-10

免責聲明！

本站轉載的文章為個人學習借鑒使用，本站對版權不負任何法律責任。如果侵犯了您的隱私權益，請聯系本站郵箱yoyou2525@163.com刪除。

猜您在找 機器學習之邏輯回歸（Logistic Regression）【機器學習】邏輯回歸（Logistic Regression）機器學習 | 算法筆記- 邏輯斯蒂回歸（Logistic Regression） Python機器學習算法 — 邏輯回歸（Logistic Regression）機器學習算法與Python實踐之（七）邏輯回歸（Logistic Regression）談談對機器學習中邏輯回歸的理解（Logistic Regression）機器學習實戰python3 Logistic Regression 斯坦福機器學習視頻筆記 Week3 邏輯回歸與正則化 Logistic Regression and Regularization Stanford機器學習筆記-6. 學習模型的評估和選擇 Stanford機器學習筆記-3.Bayesian statistics and Regularization