第二章 模型评估与选择 2.1 经验误差与过拟合 错误率(error rate):分类错误的样本数占样本总数的比例。 精度(accuracy):1 - 错误率 误差(error):学习器的实际预测输出与样本的真实输出之间的差异称为误差。 训练误差 ...
第三章 线性模型 . 基本形式 线性模型 linear model 试图学得一个通过属性的线性组合来进行预测的函数,即 一般用向量形式写成 ,其中 w 和 b 学得之后, 模型就得以确定。 . 线性回归 对离散属性的处理: 若属性值间存在序关系,可通过连续化将其转化为连续值,例如二值属性 身高 的取值 高 矮 可转化为 . , . 若属性值间不存在序关系,假定有 k 个属性值,则通常转化为 k ...
2017-06-20 16:09 0 1312 推荐指数:
第二章 模型评估与选择 2.1 经验误差与过拟合 错误率(error rate):分类错误的样本数占样本总数的比例。 精度(accuracy):1 - 错误率 误差(error):学习器的实际预测输出与样本的真实输出之间的差异称为误差。 训练误差 ...
机器学习西瓜书课后习题答案---2、模型评估 一、总结 一句话总结: 理解必然是个【逐步加深】的过程,所以前期可以【最短时间做最高效率】(重点、核心点、视频)的事情 1、【Min-max】 规范化和【z-score】 规范化的优缺点? 【Min-max】规范化:$$x ...
【第1章 绪论】 1.1 引言 学习算法:机器学习所研究的主要内容,是关于在计算机上从数据中产生“模型”的算法,即“学习算法”。 学习算法的作用:1.基于提供的经验数据产生模型; 2.面对新情况时,模型 ...
大部分基础概念知识已经在Machine Learning|Andrew Ng|Coursera 吴恩达机器学习笔记这篇博客中罗列,因此本文仅对感觉重要或不曾了解的知识点做摘记 第1章 绪论 对于一个学习算法a,若它在某问题上比学习算法b好,则必然存在另一些问题,在那里b比a好 ...
结点的路径对应了一个判定测试序列。 决策树学习的目的是为了产生一棵泛化能力强——即 ...
第五章 神经网络 5.1 神经元模型 神经网络:是由具有适应性的简单单元组成的广泛并行互连的网络,它能够模拟生物神经系统对真实世界物体所作出的交互反应。 神经网络中最基本的成分是神经元模型,即上述定义中的“简单单元 ...
习题 4.1 试证明对于不含冲突数据 (即特征向量完全相同但标记不同) 的训练集, 必存在与训练集一致 (即训练误差为 0)的决策树. 既然每个标记不同的数据特征向量都不同, 只要树的每 ...
习题 6.1 试证明样本空间中任意点 \(\boldsymbol{x}\) 到超平面 \((\boldsymbol{w}, b)\) 的距离为式 \((6.2)\) . 设超平面为 \( ...