1. x_train:包括所有自變量,這些變量將用於訓練模型,同樣,我們已經指定測試_size=0.4,這意味着來自完整數據的60%的觀察值將用於訓練/擬合模型,其余40%將用於測試模型。
2. y_train-這是因變量,需要此模型進行預測,其中包括針對自變量的類別標簽,我們需要在訓練/擬合模型時指定我們的因變量
3. x_test:這是數據中剩余的40%的自變量部分,這些自變量將不會在訓練階段使用,並將用於進行預測,以測試模型的准確性。
4. y_test-此數據具有測試數據的類別標簽,這些標簽將用於測試實際類別和預測類別之間的准確性。
5. random_state:控制隨機狀態,固定random_state后,每次構建的模型是相同的、生成的數據集是相同的、每次的拆分結果也是相同的。