K-NN算法概述

本文轉載自查看原文 2019-09-24 16:07 354

一、KNN算法（k-NearestNeighbor)，k臨近值算法：在給出一個數據點以后，判斷它和已有數據點之間的距離，取k個距離最近的點，這些點中存在的那一類點最多就講這個新的數據點歸位那一類。

• 容易存在的問題：

　　1.、k 值過小，容易出現過擬合問題，結果就是在訓練集上准確度很高，但是在測試集上就很低。

　　2、特征的比重失衡。在計算樣本點之間的距離時，如果不同的維度存在數量級差異，就會導致某些特征所起到的作用（對距離的影響）過大或過小。所以要進行歸一化處理來避免這種問題的出現。

• 距離的度量：歐式距離、曼哈頓距離、取最大值等等

二、k-d(K-demension tree)樹：將空間划分為特定的幾個部分，在特定的部分內進行相關搜索。

本站轉載的文章為個人學習借鑒使用，本站對版權不負任何法律責任。如果侵犯了您的隱私權益，請聯系本站郵箱yoyou2525@163.com刪除。

猜您在找 K-NN算法學習總結機器學習：k-NN算法（也叫k近鄰算法） K-NN graph 一文搞懂k近鄰（k-NN）算法（一）一文搞懂k近鄰（k-NN）算法機器學習實例---1.1、k-近鄰算法（簡單k-nn） [Python]基於K-Nearest Neighbors[K-NN]算法的鳶尾花分類問題解決方案 K-means VS K-NN and 手肘法 K--NN(近鄰)模型算法 k-means算法概述