掌握sklearn系列——1 学会加载数据


我们直接看代码:

from sklearn import datasets

#读取三组数据,前两个用于分类,第三个用于回归
iris = datasets.load_iris()
digits = datasets.load_digits()
boston = datasets.load_boston()

#打印datasets放在哪里了
print(datasets.get_data_home())

print('-'*30)

#查看加载的数据,都有几行,几列,如果是分类的话,都有哪几个类别,特征都是什么。如果是回归的话,特征都是什么
#先看iris
print(iris.data.shape)
print(iris.target.shape)
print(iris.target_names)
print(iris.feature_names)

print('-'*30)

#再看digits
print(digits.data.shape)
print(digits.images.shape)
print(digits.target.shape)
print(digits.target_names)

print('-'*30)

#最后看boston (回归)
print(boston.data.shape)
print(boston.target.shape)
print(boston.feature_names)

print('-'*30)

#将load的数据,画在图上看一下
import matplotlib.pyplot as plt
image0 = digits.images[0]
plt.imshow(image0)
plt.show()

 

我们的代码中,加载了三组数据,分别为iris, digits和boston
其中,前两个是用于分类的数据,你可以看到数据对应的 target_names, 由于boston是用来回归的,
回归的y一般都是一个数字,而且没法一一列举,所以,你只能看到每一维特征都代表了什么。 
 
代码执行结果:
/Users/chenkuo/scikit_learn_data
------------------------------
(150, 4)
(150,)
['setosa' 'versicolor' 'virginica']
['sepal length (cm)', 'sepal width (cm)', 'petal length (cm)', 'petal width (cm)']
------------------------------
(1797, 64)
(1797, 8, 8)
(1797,)
[0 1 2 3 4 5 6 7 8 9]
------------------------------
(506, 13)
(506,)
['CRIM' 'ZN' 'INDUS' 'CHAS' 'NOX' 'RM' 'AGE' 'DIS' 'RAD' 'TAX' 'PTRATIO'
 'B' 'LSTAT']
------------------------------
 


免责声明!

本站转载的文章为个人学习借鉴使用,本站对版权不负任何法律责任。如果侵犯了您的隐私权益,请联系本站邮箱yoyou2525@163.com删除。



 
粤ICP备18138465号  © 2018-2025 CODEPRJ.COM