模型參數
參數名 | 參數描述 | 可選值 |
---|---|---|
boosting_type | 模型提升方式 | 'gbdt'、'dart'、'goss'、'rf' |
num_leaves | 每個基學習器的最大葉子 | 默認31 |
max_depth | 基學習器樹的最大深度 | 默認-1,沒有限制 |
learning_rate | boosting學習率 | 默認0.1 |
n_estimators | 基學習器的數量 | 默認10 |
max_bin | 特征值的分桶數 | 默認255 |
subsample_for_bin | 用於分箱的樣本數 | 默認50000 |
objective | 學習任務和學習目標 | 默認regression對於LGBRegressor,LGBClassifier是'binary','multiclass',LGBMRanker是'lambdarank' |
min_split_gain | 在樹的葉子節點上做進一步分區所需的最小損失減少 | 默認0,浮點數 |
min_child_weight | 子節點(葉節點)中所需要的最小實例權重(hessian)之和 | 默認1e-3 |
min_child_samples | 葉子所需要的最小數據 | 默認20 |
subsample | 訓練樣本的子樣本比率 | 默認1,浮點數 |
subsample_freq | 子樣本的頻率 | 默認1,int |
colsample_bytree | 構造每棵樹的子樣本比率 | 默認1,浮點數 |
reg_alpha | L1正則化權重 | 默認0,浮點數 |
reg_lambda | L2正則化權重 | 默認0,浮點數 |
random_state | 隨機數種子 | 默認為None |
n_jobs | 並行線程數 | 默認為-1,全線程 |
slient | 在運行提升時,是否打印消息 | 默認為True |
fit參數
參數 | 參數描述 | 可選值 |
---|---|---|
X | 輸入特征矩陣 | n_samples,n_features |
y | 標簽 | n_samples |
sample_weight | 訓練數據的權重 | 默認None |
init_score | 初始化訓練數據得分 | 默認None |
group | 訓練集的分組數據 | 默認None |
eval_set | 用作提前停止的驗證集的(X, y) | 默認None |
eval_names | eval_set的名字 | 默認None |
eval_sample_weight | 驗證集數據的權重 | 默認None |
eval_init_score | 驗證集數據初始分數 | 默認None |
eval_group | 驗證集的分組數據 | 默認None |
eval_metric | 字符串,它應該是一個內置的評估指標。如果是可調用的,它應該是一個定制的評估指標,請參閱注釋以了解更多細節 | 默認None |
early_stopping_rounds | 激活早期停止。該模型將進行訓練,直到驗證分數停止改進。為了繼續訓練,驗證錯誤需要至少每輪減少一次 | 默認None |
verbose | 如果為True並且使用了評估集,則寫入評估進度 | 默認True |
feature_name | 特征名稱,如果' auto '和data是 DataFrame,則使用數據列名稱 | 默認auto |
categorical_feature | 分類功能,如果是int的列表,則解釋為下標。如果字符串列表,解釋為特性名稱(也需要指定feature_name),如果' auto '和data是pandas DataFrame,則使用pandas分類列 | 默認auto |
callbacks | 在每次迭代中應用的回調函數列表 | 默認None |
predict參數
參數 | 參數描述 | 可選值 |
---|---|---|
X | 輸入特征矩陣 | n_samples,n_features |
raw_score | 是否預測原始分數 | 默認False |
num_iter_action | 預測中限制迭代次數;默認為0(使用所有樹) | 默認0 |
n_features_
得到擬合模型的特征個數
objective_
獲得模型擬合的具體目標
classes_
返回標簽的所有分類(僅限於分類問題)
n_classes_
返回標簽的類別數量
best_score_
返回模型的最好分數
best_iteration
指定了early_stopping_rounds時擬合模型的最佳迭代
booster_
模型的提升方式
evals_result
如果已指定early_stopping_rounds,則計算結果
feature_importances_
返回每個特征的特征重要性