提升方法 简述:提升方法(boosting)是一种常用的统计学习方法,应用广泛且有效。在分类问题中,它通过改变训练样本的权重,学习多个分类器,并将这些分类器进行线性组合,提高分类的性能。 本章 (1)介绍boosting方法的思路和代表性的boosting算法AdaBoost (2)通过训练 ...
因为要准备面试,本文以李航的 统计学习方法 为主,结合西瓜书等其他资料对机器学习知识做一个整理. 知识点 进程和线程:进程和线程都是一个时间段的描述,是CPU工作时间段的描述,不过是颗粒大小不同.进程就是包换上下文切换的程序执行时间总和 CPU加载上下文 CPU执行 CPU保存上下文.线程是共享了进程的上下文环境的更为细小的CPU时间段。 判别式模型和生成式模型: 判别式模型直接学习决策函数f X ...
2018-03-26 21:54 6 47646 推荐指数:
提升方法 简述:提升方法(boosting)是一种常用的统计学习方法,应用广泛且有效。在分类问题中,它通过改变训练样本的权重,学习多个分类器,并将这些分类器进行线性组合,提高分类的性能。 本章 (1)介绍boosting方法的思路和代表性的boosting算法AdaBoost (2)通过训练 ...
KNN算法 基本模型:给定一个训练数据集,对新的输入实例,在训练数据集中找到与该实例最邻近的k个实例。这k个实例的多数属于某个类,就把输入实例分为这个类。 KNN没有显式的学习过程。 KNN使用的模型实际上对应于特征空间的划分。特征空间中,对每个训练实例点\(x_i\),距离该点比其它点更近 ...
10种统计学习方法特点的概括总结 本书共介绍了10种主要的统计学习方法:感知机,KNN,朴素贝叶斯,决策树,逻辑斯谛回归与最大熵模型,SVM,提升方法,EM算法,隐马尔可夫模型,条件随机场(CRF)。 适用问题 感知机,KNN,朴素贝叶斯,决策树,逻辑斯谛回归与最大熵模型,SVM,提升 ...
写在前面 本系列笔记主要记录《统计学习方法》中7种常用的机器学习分类算法,包括感知机,KNN,朴素贝叶斯,决策树,逻辑斯谛回归与最大熵模型,SVM,boosting。 课本还涉及到3种算法是关于概率模型估计和标注问题的,暂未列入学习计划,所以笔记中没有涉及,包括EM算法,隐马尔可夫模型,条件 ...
转自:https://github.com/SmirkCao/Lihang 最近又捡起了李航老师的《统计学习方法》开始啃,之前因为干货太多一看就困索性放弃(捂脸~),突然在知乎上看到有大神的总结,希望大神能带我飞哈哈。 [TOC] GitHub的markdown公式支持一般, 推荐使用 ...
第一章 统计学习方法概论 统计学习的主要特点是: (1)统计学习以计算机及网络为平台,是建立在计 算机及网络之上的; (2)统计学习以数据为研究对象,是数据驱动的学科; (3)统 ...
第12章 统计学习方法总结 1 适用问题 分类问题是从实例的特征向量到类标记的预测问题; 标注问题 是从观测序列到标记序列(或状态序列)的预测问题。可以认为分类问题是标注 问题的特殊情况。 分类问题中可能的预测结果是二类或多类; 而标注问题 ...
基本模型 简介:决策树可以认为是if-then规则的集合,也可以认为是定义在特征空间与类空间上的条件概率分布。其主要优点是模型具有可读性,分类速度快。 决策树学习通常包括3个步骤:特征选择,决策树生成,剪枝。 决策树的内部结点表示一个特征或属性,叶结点表示一个类。 If-then:决策树 ...