機器學習:鳶尾花數據集


鳶尾花數據集 (Iris Flowers Dataset )(下載地址:http://t.cn/Rf8GeUq

  鳶尾花數據集采集的是鳶尾花的測量數據以及其所屬的類別。每個類的觀察值數量是均等的。一共有 150 個觀察值,4個輸入變量和1個輸出變量。
       測量數據包括:萼片長度(cm)、萼片寬度(cm)、花瓣長度(cm)、花瓣寬度(cm)。
  類別共分為三類:Iris Setosa, Iris Versicolour, Iris Virginica。該數據集可用於多分類問題。

  使用sklearn.datasets.load_iris即可加載相關數據集。
參數:

* return_X_y: 若為True,則以(data,target)形式返回數據;默認為False,表示以字典形式返回數據全部信息(包括data和target)。

加載示例:

 

>>> from sklearn.datasets import load_iris
>>> iris = load_iris()
>>> print(iris.data.shape)
>>> print(iris.target.shape)
>>> list(iris.target_names)
輸出:

(150L, 4L)
(150L,)
Out[7]:
['setosa', 'versicolor', 'virginica'](分類名稱)

(未完待續)



 


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM