現在講下決策邊界(decision boundary)的概念。這個概念能更好地幫助我們理解邏輯回
歸的假設函數在計算什么。
在邏輯回歸中,我們預測:
當ℎ𝜃(𝑥) >= 0.5時,預測 𝑦 = 1。
當ℎ𝜃(𝑥) < 0.5時,預測 𝑦 = 0 。
根據上面繪制出的 S 形函數圖像,我們知道當
𝑧 = 0 時 𝑔(𝑧) = 0.5
𝑧 > 0 時 𝑔(𝑧) > 0.5
𝑧 < 0 時 𝑔(𝑧) < 0.5
又 𝑧 = 𝜃𝑇𝑥 ,即:
𝜃𝑇𝑥 >= 0 時,預測 𝑦 = 1
𝜃𝑇𝑥 < 0 時,預測 𝑦 = 0
現在假設我們有一個模型:
並且參數𝜃 是向量[-3 1 1]。 則當−3 + 𝑥1 + 𝑥2 ≥ 0,即𝑥1 + 𝑥2 ≥ 3時,模型將預測 𝑦 =
1。 我們可以繪制直線𝑥1 + 𝑥2 = 3,這條線便是我們模型的分界線,將預測為1 的區域和預
測為 0 的區域分隔開。
假使我們的數據呈現這樣的分布情況,怎樣的模型才能適合呢?
因為需要用曲線才能分隔 𝑦 = 0 的區域和 𝑦 = 1 的區域,我們需要二次方特征:
是[-1 0 0 1 1],則我們得到的判定邊界恰好是圓
點在原點且半徑為1 的圓形。
我們可以用非常復雜的模型來適應非常復雜形狀的判定邊界。