多分類問題
- 將郵件分為不同類別/標簽:工作(y=1),朋友(y=2),家庭(y=3),愛好(y=4)
- 天氣分類:晴天(y=1),多雲天(y=2),下雨天(y=3),下雪天(y=4)
- 醫學圖示(Medical diagrams):沒生病(y=1),感冒(y=2),流感(y=3)
二分類問題的示意圖如下
多分類問題如下
One-vs-all(one-vs-rest)
生成三個假的數據集
定義一個函數
\[h_\theta ^{\left( {\rm{1}} \right)}\left( x \right) = P\left( {y = 1|x;\theta } \right)\]
處理過的數據集就是二分類問題,通過邏輯回歸可能得到紅線區分不同類別
同理
定義函數
\[h_\theta ^{\left( {\rm{2}} \right)}\left( x \right) = P\left( {y = 2|x;\theta } \right)\]
定義函數
\[h_\theta ^{\left( {\rm{3}} \right)}\left( x \right) = P\left( {y = 3|x;\theta } \right)\]
總結公式
\[h_\theta ^{\left( {\rm{i}} \right)}\left( x \right) = P\left( {y = i|x;\theta } \right)\]
當需要預測新的數據的類別時,使用如下公式
\[\mathop {\max }\limits_i h_\theta ^{\left( {\rm{i}} \right)}\left( x \right)\]
也就是使用不同的函數去預測輸入x,分別計算不同h(x)的值,然后取其中的最大值。哪個i對應的h(x)越大,就認為屬於哪個類。