訓練數據要放到Dataset中供lgb使用,構建數據如下:
1 import lightgbm as lgb 2 import numpy as np 3 4 # 訓練數據,500個樣本,10個維度 5 train_data = np.random.rand(500, 10) 6 # 構建二分類數據 7 label = np.random.randint(2, size=500) 8 # 放入到dataset中 9 train = lgb.Dataset(train_data, label=label) 10 print(train)
很清晰的構建數據方式,記住這種用法
指定 feature names(特征名稱)和 categorical features(分類特征):
1 train_data = lgb.Dataset(data, label=label, feature_name=['c1', 'c2', 'c3'], categorical_feature=['c3'])
分類特征可以人為制定,使用categorical_feature選取你制定的名稱
