用通俗易懂的方式剖析随机森林 0.引言 随机森林是现在比较流行的一个算法。对于回归和分类问题有很好的效果,它的内在的机理到底是什么呢?接下来将会用通俗易懂的方式讲一讲随机森林。 1.什么是随机森林 随机森林分解开来就是“随机”和“森林”。“随机”的含义我们之后讲,我们先说“森林 ...
.决策树 决策树模型demo 随机森林模型demo . 从LR到决策树 相信大家都做过用LR来进行分类,总结一下LR模型的优缺点: 优点 适合需要得到一个分类概率的场景。 实现效率较高。 很好处理线性特征。 缺点 当特征空间很大时,逻辑回归的性能不是很好。 不能很好地处理大量多类特征。 对于非线性特征,需要进行转换。 以上就是LR模型的优缺点,没错,决策树的出现就是为了解决LR模型不足的地方,这 ...
2018-12-23 10:37 2 12015 推荐指数:
用通俗易懂的方式剖析随机森林 0.引言 随机森林是现在比较流行的一个算法。对于回归和分类问题有很好的效果,它的内在的机理到底是什么呢?接下来将会用通俗易懂的方式讲一讲随机森林。 1.什么是随机森林 随机森林分解开来就是“随机”和“森林”。“随机”的含义我们之后讲,我们先说“森林 ...
决策树 决策树模型是一种树形结构,基于特征对实例进行分类或回归的过程。即根据某个特征把数据分划分到若干个子区域(子树),再对子区域递归划分,直到满足某个条件则停止划分并作为叶子节点,不满足条件则继续递归划分。 一个简单的决策树分类模型:红色框出的是特征。 决策树模型学习 ...
1.线性回归(Linear Regression) 1.1什么是线性回归 我们首先用弄清楚什么是线性,什么是非线性。 线性:两个变量之间的关系是一次函数关系的——图象是直线,叫做线性。 ...
1.逻辑回归(Logistic Regression) GitHub地址(案例代码加数据) 1.1逻辑回归与线性回归的关系 逻辑回归是用来做分类算法的,大家都熟悉线性回归,一般形式是Y=aX+b,y的取值范围是[-∞, +∞],有这么多取值,怎么进行分类呢?不用担心,伟大的数学家已经 ...
1.SVM讲解 新闻分类案例 SVM是一个很复杂的算法,不是一篇博文就能够讲完的,所以此篇的定位是初学者能够接受的程度,并且讲的都是SVM的一种思想,通过此篇能够使读着会使用SVM就行,具体SVM的推导过程有一篇博文是讲得非常细的,具体链接我放到最后面,供大家参考。 1.1支持向量机(SVM ...
与SVM一样,决策树是通用的机器学习算法。随机森林,顾名思义,将决策树分类器集成到一起就形成了更强大的机器学习算法。它们都是很基础但很强大的机器学习工具,虽然我们现在有更先进的算法工具来训练模型,但决策树与随机森林因其简单灵活依然广受喜爱,建议大家学习。 一、决策树 1.1 什么是决策树 ...
目录 特征选择 信息的度量和作用 信息增益 信息增益的计算 常见决策树使用的算法 sklearn决策树API 泰坦尼克号案例 决策树的优缺点以及改进 集成学习方法-随机森林 学习算法 ...