對於訓練或預測,XGBoost采用如下格式的實例文件:
train.txt
1 101:1.2 102:0.03
0 1:2.1 10001:300 10002:400
0 0:1.3 1:0.3
1 0:0.01 1:0.3
0 0:0.2 1:0.3
每行代表一個實例,第一行'1'是實例標簽,'101'和'102'是特征索引,'1.2'和'0.03'是特征值。在二進制分類情況中,'1'用於指示陽性樣本,'0'用於指示陰性樣本。我們還支持[0,1]中的概率值作為標簽,以指示實例為正的概率。