lightGBM Python API參考以及各參數意義


模型參數

參數名 參數描述 可選值
boosting_type 模型提升方式 'gbdt'、'dart'、'goss'、'rf'
num_leaves 每個基學習器的最大葉子 默認31
max_depth 基學習器樹的最大深度 默認-1,沒有限制
learning_rate boosting學習率 默認0.1
n_estimators 基學習器的數量 默認10
max_bin 特征值的分桶數 默認255
subsample_for_bin 用於分箱的樣本數 默認50000
objective 學習任務和學習目標 默認regression對於LGBRegressor,LGBClassifier是'binary','multiclass',LGBMRanker是'lambdarank'
min_split_gain 在樹的葉子節點上做進一步分區所需的最小損失減少 默認0,浮點數
min_child_weight 子節點(葉節點)中所需要的最小實例權重(hessian)之和 默認1e-3
min_child_samples 葉子所需要的最小數據 默認20
subsample 訓練樣本的子樣本比率 默認1,浮點數
subsample_freq 子樣本的頻率 默認1,int
colsample_bytree 構造每棵樹的子樣本比率 默認1,浮點數
reg_alpha L1正則化權重 默認0,浮點數
reg_lambda L2正則化權重 默認0,浮點數
random_state 隨機數種子 默認為None
n_jobs 並行線程數 默認為-1,全線程
slient 在運行提升時,是否打印消息 默認為True

fit參數

參數 參數描述 可選值
X 輸入特征矩陣 n_samples,n_features
y 標簽 n_samples
sample_weight 訓練數據的權重 默認None
init_score 初始化訓練數據得分 默認None
group 訓練集的分組數據 默認None
eval_set 用作提前停止的驗證集的(X, y) 默認None
eval_names eval_set的名字 默認None
eval_sample_weight 驗證集數據的權重 默認None
eval_init_score 驗證集數據初始分數 默認None
eval_group 驗證集的分組數據 默認None
eval_metric 字符串,它應該是一個內置的評估指標。如果是可調用的,它應該是一個定制的評估指標,請參閱注釋以了解更多細節 默認None
early_stopping_rounds 激活早期停止。該模型將進行訓練,直到驗證分數停止改進。為了繼續訓練,驗證錯誤需要至少每輪減少一次 默認None
verbose 如果為True並且使用了評估集,則寫入評估進度 默認True
feature_name 特征名稱,如果' auto '和data是 DataFrame,則使用數據列名稱 默認auto
categorical_feature 分類功能,如果是int的列表,則解釋為下標。如果字符串列表,解釋為特性名稱(也需要指定feature_name),如果' auto '和data是pandas DataFrame,則使用pandas分類列 默認auto
callbacks 在每次迭代中應用的回調函數列表 默認None

predict參數

參數 參數描述 可選值
X 輸入特征矩陣 n_samples,n_features
raw_score 是否預測原始分數 默認False
num_iter_action 預測中限制迭代次數;默認為0(使用所有樹) 默認0

n_features_

得到擬合模型的特征個數

objective_

獲得模型擬合的具體目標

classes_

返回標簽的所有分類(僅限於分類問題)

n_classes_

返回標簽的類別數量

best_score_

返回模型的最好分數

best_iteration

指定了early_stopping_rounds時擬合模型的最佳迭代

booster_

模型的提升方式

evals_result

如果已指定early_stopping_rounds,則計算結果

feature_importances_

返回每個特征的特征重要性


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM