SVM支持向量機,一般用於二分類模型,支持線性可分和非線性划分。SVM中用到的核函數有線性核'linear'、多項式核函數pkf以及高斯核函數rbf。
當訓練數據線性可分時,一般用線性核函數,直接實現可分;
當訓練數據不可分時,需要使用核技巧,將訓練數據映射到另一個高維空間,使再高維空間中,數據可線性划分,
但需要注意的是,若樣本n和特征m很大時,且特征m>>n時,需要用線性核函數,因為此時考慮高斯核函數的映射后空間維數更高,更復雜,也容易過擬合,此時使用高斯核函數的弊大於利,選擇使用線性核會更好;
若樣本n一般大小,特征m較小,此時進行高斯核函數映射后,不僅能夠實現將原訓練數據再高維空間中實現線性划分,而且計算方面不會有很大的消耗,因此利大於弊,適合用高斯核函數;
若樣本n很大,但特征m較小,同樣難以避免計算復雜的問題,因此會更多考慮線性核。