第一章 统计学习方法概论 统计学习的主要特点是: (1)统计学习以计算机及网络为平台,是建立在计 算机及网络之上的; (2)统计学习以数据为研究对象,是数据驱动的学科; (3)统 ...
第 章 EM算法及其推广 EM算法是一种迭代算法,用于含有隐 变量 hidden variable 的概率模型参数的极大似然估计,或极大后验概率估计。 EM算法的每次迭代由两步组成:E步,求期望 expectation M步,求极大 maximization ,所以这一算法称为期望极大算法 expectation maximization algorithm ,简称EM算法 。 . EM算法的引入 ...
2015-08-28 18:04 0 2497 推荐指数:
第一章 统计学习方法概论 统计学习的主要特点是: (1)统计学习以计算机及网络为平台,是建立在计 算机及网络之上的; (2)统计学习以数据为研究对象,是数据驱动的学科; (3)统 ...
第12章 统计学习方法总结 1 适用问题 分类问题是从实例的特征向量到类标记的预测问题; 标注问题 是从观测序列到标记序列(或状态序列)的预测问题。可以认为分类问题是标注 问题的特殊情况。 分类问题中可能的预测结果是二类或多类; 而标注问题 ...
提升方法 简述:提升方法(boosting)是一种常用的统计学习方法,应用广泛且有效。在分类问题中,它通过改变训练样本的权重,学习多个分类器,并将这些分类器进行线性组合,提高分类的性能。 本章 (1)介绍boosting方法的思路和代表性的boosting算法AdaBoost (2)通过训练 ...
第7章 支持向量机 支持向量机(support vector machines, SVM)是一种二类分类模型。它的基本模型是定义在特征空间上的间隔最大的线性分类器;支持向量机还包括核技巧,这使它成为实质上的非线性分类器。支持向量机的学习策略就是间隔最大化,可形式化为一个求解凸二次规划 ...
第11章 条件随机场 条件随机场(conditional random field, CRF)是给定一组输入随机变量条件下 另一组输出随机变量的条件概率分布模型,其特点是假设输出随机变量构成马尔 可夫随机场。条件随机场可以用于不同的预测问题,本章 主要讲述线性链(linear ...
支持向量机(supportvectormachines,SVM) 是一种二类分类模型.它的基本模型是定义在特征空间上的间隔最大的线性分类器,间隔最大使它有别于感知机; 支持向量机还包括核技巧,这使它成为实质上的非线性分类器.支持向量机的学习策略就是间隔最大化,可形式化为一个求解凸二次 ...
KNN算法 基本模型:给定一个训练数据集,对新的输入实例,在训练数据集中找到与该实例最邻近的k个实例。这k个实例的多数属于某个类,就把输入实例分为这个类。 KNN没有显式的学习过程。 KNN使用的模型实际上对应于特征空间的划分。特征空间中,对每个训练实例点\(x_i\),距离该点比其它点更近 ...
提升(boosting) 方法是一种常用的统计学习方法,应用广泛且有效.在分类问题中,它通过改变训练样本的权重,学习多个分类器,并将这些分类器进行线性组合,提高分类的性能.本章首先介绍提升方法的思路和代表性的提升算法AdaBoost; 然后通过训练误差分析探讨AdaBoost ...