支持向量機的目的是尋找一個能講兩類樣本正確分類的超平面,很多時候這些樣本並不是線性分布的。
由此,可以將原始特征空間映射到更高維的特征空間,使其線性可分。而且,如果原始空間是有限維,即屬性數量有限,
那么一定存在一個高維特征空間使樣本可分。
k(.,.)就是核函數。整理后
定理證明:只要一個對稱函數所對應的核矩陣半正定,它就能作為核函數使用。
此外,還可以組合函數得到新的核函數,比如假設K1和K2都是核函數,線性組合:r1K1+r2K2也是核函數,還有:
軟間隔:
在分類問題中,我們很難完全將數據映射到一個線性可分的特征空間當中,而且即使取得了較好的分類結果,也不能確定是不是由於過擬合引起的。
具體地,支持向量機要求所有樣本都必須划分正確,這叫做“硬間隔”,而軟間隔是允許一部分樣本不滿足約束條件的,但這樣的樣本要盡可能少。