首先引入需要的包 载入数据集,使数据中心化(减去平均值) 先看一下前16张训练机和数据集都长什么样, 使用plt画出图像 求出平均脸, 简单计算,其实就是把每个像素求出平均值, 画出来看看, 就长这样 所有图片都减去平均脸 把所有像素摊平(都变成 ...
由于KNN的计算量太大,还没有使用KD tree进行优化,所以对于 训练集, 测试集的数据计算比较慢。这里只是想测试观察一下KNN的效果而已,不调参。 K选择之前看过貌似最好不要超过 ,因此,此处选择了K ,距离为欧式距离。如果需要改进,可以再调整K来选择最好的成绩。 先跑了一遍不经过scale的,也就是直接使用像素灰度值来计算欧式距离进行比较。发现开始基本稳定在 的正确率上,吓了一跳。因为本来觉 ...
2015-12-08 20:25 0 2213 推荐指数:
首先引入需要的包 载入数据集,使数据中心化(减去平均值) 先看一下前16张训练机和数据集都长什么样, 使用plt画出图像 求出平均脸, 简单计算,其实就是把每个像素求出平均值, 画出来看看, 就长这样 所有图片都减去平均脸 把所有像素摊平(都变成 ...
MNIST数据集包含了70000张0~9的手写数字图像。 一、准备工作:导入MNIST数据集 fatch_openml用来加载数据集,所加载的数据集是一个key-value的字典结构 输入:mnist.keys() 可以看到字典的键值包括:dict_keys(['data ...
一 数据预处理 训练数据集和验证数据集分别为train.csv和test.csv。数据集下载地址:http://pan.baidu.com/s/1eQyIvZG 要分别对训练数据集和验证数据集进行分析,分析其内部数据的特征,下面分别对两个数据集进行处理: 1.1 训练数据集处理 ...
filename='g:\data\iris.csv' lines=fr.readlines()Mat=zeros((len(lines),4))irisLabels=[]index=0for li ...
一、KNN算法的介绍 K最近邻(k-Nearest Neighbor,KNN)分类算法是最简单的机器学习算法之一,理论上比较成熟。KNN算法首先将待分类样本表达成和训练样本一致的特征向量;然后根据距离计算待测试样本和每个训练样本的距离,选择距离最小的K个样本作为近邻样本;最后根据K个近邻样本 ...
mnist 数据集:包含 7 万张黑底白字手写数字图片,其中 55000 张为训练集,5000 张为验证集,10000 张为测试集。每张图片大小为 28*28 像素,图片中纯黑色像素值为 0,纯白色像素值为 1。数据集的标签是长度为 10 的一维数组,数组中每个元素索引号表示对应 ...
TensorFlow提供了一个库,可以直接用来自动下载与安装MNIST。 MNIST里包含3个数据集:第一个是训练数据集(mnist.train.images),另外两个分别是测试数据集(mnist.test.images)和验证数据集(mnist.validation)。 代码中 ...
首先对数据进行读取与处理 然后实现KNN分类算法 上边是把原始数据集切割为测试集和训练集,然后创建KNN对象进行训练和测试 ...