原文:(数据科学学习手札23)决策树分类原理详解&Python与R实现

作为机器学习中可解释性非常好的一种算法,决策树 Decision Tree 是在已知各种情况发生概率的基础上,通过构成决策树来求取净现值的期望值大于等于零的概率,评价项目风险,判断其可行性的决策分析方法,是直观运用概率分析的一种图解法。由于这种决策分支画成图形很像一棵树的枝干,故称决策树。在机器学习中,决策树是一个预测模型,他代表的是对象属性与对象值之间的一种映射关系。 一 初识决策树 决策树是 ...

2018-04-06 14:47 0 1726 推荐指数:

查看详情

数据科学学习手札29)KNN分类原理详解&PythonR实现

一、简介   KNN(k-nearst neighbors,KNN)作为机器学习算法中的一种非常基本的算法,也正是因为其原理简单,被广泛应用于电影/音乐推荐等方面,即有些时候我们很难去建立确切的模型来描述几种类别的具体表征特点,就可以利用天然的临近关系来进行分类; 二、原理   KNN ...

Thu Apr 26 06:11:00 CST 2018 0 1109
数据科学学习手札26)随机森林分类原理详解&PythonR实现

一、简介   作为集成学习中非常著名的方法,随机森林被誉为“代表集成学习技术水平的方法”,由于其简单、容易实现、计算开销小,使得它在现实任务中得到广泛使用,因为其来源于决策树和bagging,决策树我在前面的一篇博客中已经详细介绍,下面就来简单介绍一下集成学习与Bagging; 二、集成 ...

Sat Apr 14 04:04:00 CST 2018 0 6244
数据科学学习手札24)逻辑回归分类原理详解&PythonR实现

一、简介   逻辑回归(Logistic Regression),与它的名字恰恰相反,它是一个分类器而非回归方法,在一些文献里它也被称为logit回归、最大熵分类器(MaxEnt)、对数线性分类器等;我们都知道可以用回归模型来进行回归任务,但如果要利用回归模型来进行分类该怎么办呢?本文介绍的逻辑 ...

Thu Apr 12 22:44:00 CST 2018 1 2907
数据科学学习手札34)多层感知机原理详解&PythonR实现

一、简介   机器学习分为很多个领域,其中的连接主义指的就是以神经元(neuron)为基本结构的各式各样的神经网络,规范的定义是:由具有适应性的简单单元组成的广泛并行互连的网络,它的组织能够模拟生物神经系统对真实世界的刺激作出的交互反应。而我们在机器学习中广泛提及的神经网络学习就是机器学习 ...

Tue May 08 04:09:00 CST 2018 0 2707
数据科学学习手札13)K-medoids聚类算法原理简介&PythonR实现

前几篇我们较为详细地介绍了K-means聚类法的实现方法和具体实战,这种方法虽然快速高效,是大规模数据聚类分析中首选的方法,但是它也有一些短板,比如在数据集中有脏数据时,由于其对每一个类的准则函数为平方误差,当样本数据中出现了不合理的极端值,会导致最终聚类结果产生一定的误差,而本篇将要介绍 ...

Sun Mar 18 23:17:00 CST 2018 12 12391
 
粤ICP备18138465号  © 2018-2025 CODEPRJ.COM