鳶尾花數據集 (Iris Flowers Dataset )(下載地址:http://t.cn/Rf8GeUq)
鳶尾花數據集采集的是鳶尾花的測量數據以及其所屬的類別。每個類的觀察值數量是均等的。一共有 150 個觀察值,4個輸入變量和1個輸出變量。
測量數據包括:萼片長度(cm)、萼片寬度(cm)、花瓣長度(cm)、花瓣寬度(cm)。
類別共分為三類:Iris Setosa, Iris Versicolour, Iris Virginica。該數據集可用於多分類問題。
使用sklearn.datasets.load_iris即可加載相關數據集。
參數:
* return_X_y: 若為True,則以(data,target)形式返回數據;默認為False,表示以字典形式返回數據全部信息(包括data和target)。
加載示例:
>>> from sklearn.datasets import load_iris
>>> iris = load_iris()
>>> print(iris.data.shape)
>>> print(iris.target.shape)
>>> list(iris.target_names)
輸出:
Out[7]: