标签【1.统计学习方法】

线性分类 Linear Classification

软分类：y 的取值只有正负两个离散值，例如 {0, 1} 硬分类：y 是正负两类区间中的连续值，例如 [0, 1] 一、感知机主要思想：分错的样本数越少越好用指示函数统计分错的样本数 ...

Adaboost + CART 用 CART 决策树来作为 Adaboost 的基础学习器但是问题在于，需要把决策树改成能接收带权样本输入的版本。（need: weighted DTr ...

集成方法 Ensemble

一、bagging 用于基础模型复杂、容易过拟合的情况，用来减小 variance（比如决策树）。基础模型之间没有太多联系（相对于boosting来说），训练可以并行。但用 bagging 并不能有 ...

一、主要思想利用正交变换把可能线性相关变量表示的观测数据，转换为由少数几个线性无关变量（主成分）表示的数据。（重构原始特征空间；线性降维）要尽可能保留原始数据中的信息，两个思路： ...

线性回归 Linear Regression

一、主要思想在 L2-norm 的误差意义下寻找对所有观测目标值 Y 拟合得最好的函数 f(X) = WTX 。其中 yi 是 scalar，xi 和 W 都是 P 维向量（比实际的 xi 多 ...