1、K-近邻算法(KNN) 1.1 定义 (KNN,K-NearestNeighbor) 如果一个样本在特征空间中的k个最相似(即特征空间中最邻近)的样本中的大多数属于某一个类别,则该样本也属于这个类别。 1.2 距离公式 两个样本的距离可以通过如下公式计算,又叫欧式距离。 简单 ...
分类算法:对目标值进行分类的算法 sklearn转换器 特征工程 和预估器 机器学习 KNN算法 根据邻居确定类别 欧氏距离 k的确定 ,时间复杂度高,适合小数据 模型选择与调优 朴素贝叶斯算法 假定特征互独立 贝叶斯公式 概率计算 拉普拉斯平滑系数 ,假定独立,对缺失数据不敏感,用于文本分类 决策树 找到最高效的决策顺序 信息增益 关键特征 信息熵 条件熵 可以可视化 随机森林 bootsta ...
2019-03-10 12:07 0 975 推荐指数:
1、K-近邻算法(KNN) 1.1 定义 (KNN,K-NearestNeighbor) 如果一个样本在特征空间中的k个最相似(即特征空间中最邻近)的样本中的大多数属于某一个类别,则该样本也属于这个类别。 1.2 距离公式 两个样本的距离可以通过如下公式计算,又叫欧式距离。 简单 ...
k-近邻算法采用测量不同特征值之间的距离来进行分类 优点:精度高、对异常值不敏感、无数据输入假定 缺点:计算复杂度高、空间复杂度高 使用数据范围:数值型和标称型 决策树是一种基本的分类方法,也可以用于回归。决策树模型呈树形结构。在分类问题 ...
一、决策树 定下一个最初的质点,从该点出发、分叉。(由于最初质点有可能落在边界值上,此时有可能会出现过拟合的问题。 二、SVM svm是除深度学习在深度学习出现之前最好的分类算法了。它的特征如下: (1)它既可应用于线性(回归问题)分类,也可应用于非线性分类 ...
机器学习算法·决策树和朴素贝叶斯算法 一、问题描述 1912年当时世界上体积最庞大,内部设施最豪华的客运轮船’泰坦尼克号’,拥有美誉‘永不沉没’。然而在第一次下水穿越大西洋时,就在航行中撞上冰山,永远沉没海底。船上丧生者达到1500多人。假如我们穿越时空回到了过去,成为船上的一名普通乘客 ...
第一篇:从决策树学习谈到贝叶斯分类算法、EM、HMM 引言 最近在面试中(点击查看:我的个人简历,求职意向,择司标准),除了基础 & 算法 & 项目之外,经常被问到或被要求介绍和描述下自己所知道的几种分类或聚类算法(当然,这完全 ...
今年毕业时的毕设是有关大数据及机器学习的题目。因为那个时间已经步入前端的行业自然选择使用JavaScript来实现其中具体的算法。虽然JavaScript不是做大数据处理的最佳语言,相比还没有优势,但是这提升了自己对与js的理解以及弥补了一点点关于数据结构的弱点。对机器学习感兴趣的朋友 ...
Matlab中常用的分类器有随机森林分类器、支持向量机(SVM)、K近邻分类器、朴素贝叶斯、集成学习方法和鉴别分析分类器等。各分类器的相关Matlab函数使用方法如下:首先对以下介绍中所用到的一些变量做统一的说明: train_data——训练样本,矩阵的每一行数据构成一个样本,每列表示一种 ...
目录 特征选择 信息的度量和作用 信息增益 信息增益的计算 常见决策树使用的算法 sklearn决策树API 泰坦尼克号案例 决策树的优缺点以及改进 集成学习方法-随机森林 学习算法 ...