《机器学习实战》终于到手了,开始学习了。由于本人python学的比较挫,所以学习笔记里会有许多python的内容。 1、 python及其各种插件的安装 由于我使用了win8.1 64位系统(正版的哦),所以像numpy 和 matploblib这种常用的插件不太好装,解决方案 ...
很久没写过博客了,一重开就给自己挖了这么一个大坑 最近一段时间看了 机器学习实战 这本书,感觉写得不错,认真看了看。关于这本书的书评及购买事宜请移步豆瓣 京东 亚马逊等网站,这里不多说。不过有一点,感觉这本书有个很好的地方是给出了各个算法的Python实现代码和讲解,要求不高的话可以拿来用了 懒 。在这里想好好写写从这本书中学到的东西,文中的代码和主要内容也将均来自这本书。 目录 第一部分 分类 ...
2015-05-17 23:26 13 17864 推荐指数:
《机器学习实战》终于到手了,开始学习了。由于本人python学的比较挫,所以学习笔记里会有许多python的内容。 1、 python及其各种插件的安装 由于我使用了win8.1 64位系统(正版的哦),所以像numpy 和 matploblib这种常用的插件不太好装,解决方案 ...
一、 K邻近算法思想:存在一个样本数据集合,称为训练样本集,并且每个数据都存在标签,即我们知道样本集中每一数据(这里的数据是一组数据,可以是n维向量)与所属分类的对应关系。输入没有标签的新数据后 ...
目的:改进约会网站配对效果 数据样本 下载地址 (百度网盘) 读取txt数据的代码 这段代码没有什么好解释的,注意一点 listFromLine[0:3] 表示的是0,1,2下标 ...
k-近邻算法很简单,这里就不赘述了,主要看一下python实现这个算法的一些细节。下面是书中给出的算法的具体实现。 def clssify(inX,dataset,label,k): ...
一. KNN原理: 1. 有监督的学习 根据已知事例及其类标,对新的实例按照离他最近的K的邻居中出现频率最高的类别进行分类。伪代码如下: 1)计算已知类别数据集中的点与当前点之间的距离 2)按照距离从小到大排序 3)选取与当前点距离最小的k个点 4)确定这k个点所在类别 ...
一、监督学习(supervised-learning)与无监督学习(unsupervised-learning) 1.监督学习中数据集是由特征组和标签组成,目的是训练机器对标签取值的准确预测。如:房价预测、肿瘤判定、垃圾邮件判定。 2.无监督学习中人工不对数据集作 ...
一,引言 前面讲到的基本都是分类问题,分类问题的目标变量是标称型数据,或者离散型数据。而回归的目标变量为连续型,也即是回归对连续型变量做出预测,最直接的办法是依据输入写出一个目标值的计算公式 ...
python机器学习实战(二) 版权声明:本文为博主原创文章,转载请指明转载地址 http://www.cnblogs.com/fydeblog/p/7159775.html 前言 这篇notebook是关于机器学习监督学习中的决策树算法,内容包括决策树算法的构造过程,使用 ...