這里就不多贅述了,預測問題需要根據歷史數據來預測未來,因此我們將數據進行切分,歷史數據用來訓練,未來數據用來預測,直接上!!!
data1 = pd.read_excel("python導學課數據/切分數據/歷史購買數據.xlsx")
data2 = pd.read_excel("python導學課數據/切分數據/需要預測數據.xlsx")
進一步來熟悉下數據,我們是根據“商品價格水平”、用戶“年齡水平”和“和商鋪評分”來預測“用戶是否購買”,換句話說,前者相當於是自變量,后者相當於是因變量!
這里的預測采用線性模型邏輯回歸進行!
from sklearn.linear_model import LogisticRegression
model = LogisticRegression() # 創建模型
model.fit(data1[["商品價格水平", "用戶年齡水平", "商鋪評分"]], data1["用戶是否購買"]) # 訓練模型
這里就不過多進行說明了, 這個對於初學者來說應該也很容易理解了!輸出以下內容說明模型訓練完成了!
接下來就是采用訓練好的模型進行預測!此處注意預測時不需要輸入數據“用戶是否購買”!!!
pred = model.predict(data2[["商品價格水平", "用戶年齡水平", "商鋪評分"]])
得到以下輸出證明模型預測完成,這里邊有0和1,表示購買和不購買!
接下來需要對預測結果進行評價了!輸入數據為用戶購買情況的真實數據和預測數據!
from sklearn.metrics import accuracy_score
accuracy_score(data2["用戶是否購買"], pred)
得到結果為