Andrew Ng機器學習算法入門((七):特征選擇和多項式回歸


特征選擇

還是回歸到房價的問題。在最開始的問題中,我們假設房價與房屋面積有關,那么最開始對房價預測的時候,回歸方程可能如下所示:

其中frontage表示的房子的長,depth表示的是房子的寬。
但長和寬顯然不是用於預測房價的一個很好的特征,正常的特征應該是房屋面積,那么正常的線性方程應該為:

其中X表示的房屋面積。

所以選擇了合適的特征,對算法進行預測和分類是非常有好處的

多項式回歸

很多時候,線性回歸可能無法很好地擬合實際情況。例如房屋面積與房價之間的關系如下:

很明顯,線性回歸的方式無法很好地解決這個問題。
那么此時就可以考慮多項式的方式來解決這個問題。

相對來說,這樣就可以更加擬合了。

但是有一點問題在於,如果是X的立方,則最后可能會有一個下降的趨勢。但是根據實際情況,房價應該是隨着房屋面積正增長的。那么最后的方程變為:

為了能到遠方,腳下的每一步都不能少


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM