掌握sklearn系列——1 學會加載數據


我們直接看代碼:

from sklearn import datasets

#讀取三組數據,前兩個用於分類,第三個用於回歸
iris = datasets.load_iris()
digits = datasets.load_digits()
boston = datasets.load_boston()

#打印datasets放在哪里了
print(datasets.get_data_home())

print('-'*30)

#查看加載的數據,都有幾行,幾列,如果是分類的話,都有哪幾個類別,特征都是什么。如果是回歸的話,特征都是什么
#先看iris
print(iris.data.shape)
print(iris.target.shape)
print(iris.target_names)
print(iris.feature_names)

print('-'*30)

#再看digits
print(digits.data.shape)
print(digits.images.shape)
print(digits.target.shape)
print(digits.target_names)

print('-'*30)

#最后看boston (回歸)
print(boston.data.shape)
print(boston.target.shape)
print(boston.feature_names)

print('-'*30)

#將load的數據,畫在圖上看一下
import matplotlib.pyplot as plt
image0 = digits.images[0]
plt.imshow(image0)
plt.show()

 

我們的代碼中,加載了三組數據,分別為iris, digits和boston
其中,前兩個是用於分類的數據,你可以看到數據對應的 target_names, 由於boston是用來回歸的,
回歸的y一般都是一個數字,而且沒法一一列舉,所以,你只能看到每一維特征都代表了什么。 
 
代碼執行結果:
/Users/chenkuo/scikit_learn_data
------------------------------
(150, 4)
(150,)
['setosa' 'versicolor' 'virginica']
['sepal length (cm)', 'sepal width (cm)', 'petal length (cm)', 'petal width (cm)']
------------------------------
(1797, 64)
(1797, 8, 8)
(1797,)
[0 1 2 3 4 5 6 7 8 9]
------------------------------
(506, 13)
(506,)
['CRIM' 'ZN' 'INDUS' 'CHAS' 'NOX' 'RM' 'AGE' 'DIS' 'RAD' 'TAX' 'PTRATIO'
 'B' 'LSTAT']
------------------------------
 


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM