NearestNeighbors
(n_neighbors=5, radius=1.0, algorithm='auto', leaf_size=30, metric='minkowski', p=2, metric_params=None, n_jobs=None)
Parameters(參數):
n_neighbors(n鄰域):所要選用的最近鄰的數目,相當於knn算法(k近鄰算法)中的 k,(default = 5),在設置此參數時輸入的需為整形(int)。
radius(半徑):要使用的參數空間范圍,在設置此參數時輸入的需為浮點數(float)。
algorithm{‘auto’, ‘ball_tree’, ‘kd_tree’, ‘brute’}:即用於選取計算最近鄰的算法:這里主要包括
‘auto’ :根據樣本數據自動刷選合適的算法。
‘ball_tree’:構建“球樹”算法模型。
‘kd_tree’ :‘’kd樹‘’算法。
‘brute’ :使用蠻力搜索,即或相當於Knn算法,需遍歷所有樣本數據與目標數據的距離,進而按升序排序從而選取最近的K個值,采用投票得出結果。
( 注意:擬合稀疏輸入將覆蓋此參數的設置,使用蠻力。)
leaf_size:葉的大小,針對算法為球樹或KD樹而言。這個設置會影響構造和查詢的速度,以及存儲樹所需的內存。最優值取決於問題的性質。
metric:用於樹的距離度量。默認度量是Minkowski,p=2等價於標准的歐幾里德度量。有關可用度量的列表,可以查閱距離度量類的文檔。如果度量是“預先計算的”,則假定X是距離矩陣,在擬合期間必須是平方。
p:Minkowski度量參數的參數來自sklearn.emeics.pairwise.pairwise_距離。當p=1時,這等價於使用曼哈頓距離(L1),歐幾里得距離(L2)等價於p=2時,對於任意的p,則使用Minkowski_距離(L_P)。
metric_params:度量函數的附加關鍵字參數,設置應為dict(字典)形式。
n_jobs:要為鄰居搜索的並行作業的數量。None
指1,除非在 joblib.parallel_backend背景。-1
意味着使用所有處理器,若要了解相關的知識應該具體查找一下。