機器學習筆記(1): 模型和 cost function


表達模型

變量表示

x(i) : 第 i 個輸入變量,也稱為輸入特征

y(i) : 第 i 個輸入變量,即我們希望預測的內容

(x(i), y(i)) ; i = 1,...,m : 表示一個訓練集

X : 輸入值空間; Y : 輸出值空間

 

模型的表達

對於監督學習來說,就是給定一個訓練集,輸出一個函數 h:X --> Y,使函數 h(x) 能夠預測對應的 y 值。

函數 h (由於歷史原因)叫做 hypothesis

 

 回歸問題:當輸出 y 是連續值時,我們稱之為回歸問題,如根據房屋面積預測房價

 分類問題:當輸出 y 是離散值時,我們稱之為分類問題,如給定面積預測房子是house還是apartment

 


 

損失函數(cost function)

cost function: 用來測量 hypothesis 函數的准確度的函數

損失函數又叫平方差函數

我們要找到合適的 θ0 和 θ1 ,讓 J0, θ1) 的值最小

 

以線性函數 hθ (x) = θ+ θ1x為例,假設 θ0 = 0,數據集為(1, 1), (2, 2), (3, 3),

當 θ1 為 1 時, cost function 為0為最佳情況,如下圖

 

當 θ1 為1 時, cost function 為 0.58

繼續計算 θ的其他值,我們可以得到下圖

我們的目的是最小化 cost function ,  θ1 為1時,cost function 最小

 

當 θ0 和 θ都不為0時, 可以用等高線來表示 cost function,每條線上的 J0, θ1) 值都相等

θ0 = 800,  θ1 = -0.15

θ0 = 360,  θ1 = 0, J0, θ1) 的值更接近等高線的中心, J0, θ1)的值更小了

θ0 = 250,  θ1 = 0.12, J0, θ1) 的值最小,在內層圓形的中心

 



免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM