scikit_learn (sklearn)庫中NearestNeighbors（最近鄰）函數的各參數說明

本文轉載自查看原文 2019-12-26 18:17 3437

NearestNeighbors(n_neighbors=5, radius=1.0, algorithm='auto', leaf_size=30, metric='minkowski', p=2, metric_params=None, n_jobs=None）

Parameters(參數):

n_neighbors（n鄰域）:所要選用的最近鄰的數目，相當於knn算法（k近鄰算法）中的 k,(default = 5)，在設置此參數時輸入的需為整形（int）。

radius（半徑）:要使用的參數空間范圍，在設置此參數時輸入的需為浮點數（float）。

algorithm{‘auto’, ‘ball_tree’, ‘kd_tree’, ‘brute’}：即用於選取計算最近鄰的算法：這里主要包括

　　　 ‘auto’ ：根據樣本數據自動刷選合適的算法。

‘ball_tree’：構建“球樹”算法模型。

‘kd_tree’ ：‘’kd樹‘’算法。

‘brute’ ：使用蠻力搜索，即或相當於Knn算法，需遍歷所有樣本數據與目標數據的距離，進而按升序排序從而選取最近的K個值，采用投票得出結果。

（注意：擬合稀疏輸入將覆蓋此參數的設置，使用蠻力。）

leaf_size：葉的大小，針對算法為球樹或KD樹而言。這個設置會影響構造和查詢的速度，以及存儲樹所需的內存。最優值取決於問題的性質。

metric：用於樹的距離度量。默認度量是Minkowski，p=2等價於標准的歐幾里德度量。有關可用度量的列表，可以查閱距離度量類的文檔。如果度量是“預先計算的”，則假定X是距離矩陣，在擬合期間必須是平方。

p：Minkowski度量參數的參數來自sklearn.emeics.pairwise.pairwise_距離。當p=1時，這等價於使用曼哈頓距離(L1)，歐幾里得距離(L2)等價於p=2時，對於任意的p，則使用Minkowski_距離(L_P)。

metric_params：度量函數的附加關鍵字參數，設置應為dict（字典）形式。

n_jobs：要為鄰居搜索的並行作業的數量。None指1，除非在 joblib.parallel_backend背景。-1意味着使用所有處理器，若要了解相關的知識應該具體查找一下。

本站轉載的文章為個人學習借鑒使用，本站對版權不負任何法律責任。如果侵犯了您的隱私權益，請聯系本站郵箱yoyou2525@163.com刪除。

猜您在找 scikit_learn 中文說明入門 scikit_learn lasso詳解 sklearn中SVC和SVR的參數說明 scikit_learn分類器詳解 python函數定義中的參數說明 Xgboost的sklearn接口參數說明 sklearn.svm.SVC參數說明 python 函數參數說明 VLOOKUP函數參數說明： anaconda的新建環境sklearn下安裝numpy庫和scikit-learn庫