首先我們來看下面一組數據集:
前面的x1與x2都表示的是年收入和年齡這兩個因素決定的是否買車的結果。
開始代碼部分,我們先輸入x和y的變量,開始輸入數據:
from sklearn import linear_model X=[[20,3], [23,7], [31,10], [42,13], [50,7], [60,5]]
Y=[0, 1, 1, 1, 0, 0]
擬合邏輯回歸模型:
lr=linear_model.LogisticRegression(solver='liblinear')#在新版的sklearn當中只需要指定后面的參數值就不會進行報錯啦! lr.fit(X,Y)
這個時候我們的模型已經擬合好了,現在可以開始進行輸出了,隨便用一個數據來測試在這個模型下這個人是否買車,以及是否買車的概率:
textX=[[28,8]] lable=lr.predict(textX)#看它是否有車,1表示有
輸出:
array([1])
輸出為一,說明這個人已經買車了,下面是輸出概率:
#現在輸出有車的概率 predict=lr.predict_proba(textX)
predict
輸出為:
array([[0.14694811, 0.85305189]])
#前面有兩個值,這是因為前面的一個概率預測為0的概率,后面的為概率預測為1的概率
得解也,邏輯回歸模型的編程還是十分容易的啦