摘要
本文主要說明SVM中用到的超平面方程是怎么來的,以及各個符號的物理意義,怎么算空間上某點到該平面的距離。
正文
《 統計學習方法》一書給出如下說明:
首先說明我對超平面的理解:
在三維坐標系里,XoY平面把三維坐標系”分割”成兩個空間,這個分割平面引申到一維,二維,四維空間…來,他就是一個超平面。一維里是一個點分割空間,二維里是條線,3維剛好是個平面,4維的用幾何已經無法表示了,但是我們賦予這個分割的東西為超平面,就比較形象了。
對於這個分離超平面方程時怎么來的,書中如此解釋:
這里的符號造成了一定的誤解,w時向量還是矩陣,b是向量嗎…
不失一般性,我們在二維里面推導這個方程和其物理意義,然后推廣到多維空間。
符號說明:w (超平面的法向量<這里的法向量尚未歸一化>,黑體,斜體),x(空間的任意向量,黑體,斜體),b(實數)。
下面來看法向量w的提出有什么意義:
對於x在這里可以看做由[0,0]到超平面任意‘點’的向量;
w法向量 的大小是[0,0]到分離超平面的距離,方向由分離超平面決定,或者說其方向決定了分離超平面,就像是先有雞還是先有蛋的問題。
至此,我們論述了該方程確實可以表示一個二維空間里的超平面,推廣到多維也是如此。接下來我們看下怎么計算空間里任一點A到該超平面的距離。