1.第一種方法(直接下載訓練數據集和測試集)
iris_training.csv訓練數據集,120條樣本數據;
iris_test.csv測試數據集,30條數據。
其中有花萼長度(Sepal Length)、花萼寬度(Sepal Width)、花瓣長度(Petal Length)、花瓣寬度(Petal Width)四個屬性。標簽0、1、2分別表示山鳶尾(Setosa)、變色鳶尾(Versicolor)、維吉尼亞鳶尾(Virginical)
下載之后是一個csv文件,不要看紅框內容,只是一個統計,下方每列內容分別對應我上面所說內容
2.第二種方法
from sklearn.datasets import load_iris
import pandas as pd
data = load_iris()
outputfile = "iris.xls" # 保存文件路徑名
column = list(data['feature_names'])
dd = pd.DataFrame(data.data, index=range(150), columns=column)
dt = pd.DataFrame(data.target, index=range(150), columns=['outcome'])
jj = dd.join(dt, how='outer') # 用到DataFrame的合並方法,將data.data數據與data.target數據合並
jj.to_excel(outputfile) # 將數據保存到outputfile文件中