---恢復內容開始---
IRIS分類問題
分類:根據數據集目標的特征和屬性,划分為已有的類別中
常用的分類算法:K緊鄰(KNN),邏輯回歸,決策樹,朴素貝葉斯
#iris數據加載
from sklearn import datasets
iris=datasets.load_iris()
#展示iris數據
print(iris.data)
In [3]:
#打印出屬性名稱
print(iris.feature_names)
In [4]:
#打印輸出的結果
print(iris.target)
In [5]:
#結果的含義
print(iris.target_names)
In [6]:
#確認數據類型
print(type(iris.data))
In [7]:
print(type(iris.target))
In [8]:
#確認輸入的數據維度,行列
print(iris.data.shape)
In [9]:
#確認輸出數據的維度,只有1列
print(iris.target.shape)
In [10]:
#x輸入數據賦值,y輸出數據賦值
x=iris.data
y=iris.target
In [11]:
#確認x
print(x)
In [12]:
#確認y
print(y)
In [13]:
#使用scikit-learn建模四步驟
#1,模型調用
from sklearn.neighbors import KNeighborsClassifier
In [14]:
#2,創建實例
knn=KNeighborsClassifier(n_neighbors=1)
In [15]:
print(knn)
In [16]:
#3,模型訓練
knn.fit(x,y)
Out[16]:
In [18]:
#4,模型對一個樣本的預測
knn.predict([[1,2,3,4]])
Out[18]:
In [19]:
#模型對多個樣本的預測
x_test=[[1,2,3,4],[2,4,1,2]]
knn.predict(x_test)
Out[19]:
In [20]:
#設定一個新的k值進行KNN建模
knn_5=KNeighborsClassifier(n_neighbors=5)
knn_5.fit(x,y)
knn.predict(x_test)
Out[20]:
In [21]:
#確認模型結構
print(knn_5)
In [ ]:
---恢復內容結束---
