为什么机器学习中常常假设数据是独立同分布的？

本文转载自查看原文 2018-04-05 12:07 3710 机器学习

独立、相关的关系：

独立，两个事件的发生没有任何关系

相关，一般指线性相关，不相关指不线性相关，但或许满足非线性相关

同分布：

意味着X1和X2具有相同的分布形状和相同的分布参数，对离散随机变量具有相同的分布律，对连续随机变量具有相同的概率密度函数，有着相同的分布函数，相同的期望、方差。

独立同分布（iid）

在不少问题中要求样本（数据）采样自同一个分布是因为希望用训练数据集训练得到的模型可以合理用于测试集，使用同分布假设能够使得这个做法解释得通。

（机器学习就是利用当前获取到的信息（或数据）进行训练学习，用以对未来的数据进行预测、模拟。因此需要我们使用的历史数据具有总体的代表性。）

本站转载的文章为个人学习借鉴使用，本站对版权不负任何法律责任。如果侵犯了您的隐私权益，请联系本站邮箱yoyou2525@163.com删除。

猜您在找 数据的独立同分布检验独立同分布（iid）独立同分布（总结）机器学习九机器学习中常用的采样方法关于机器学习中的i.i.d假设机器学习基础---逻辑回归（假设函数与线性回归不同）机器学习——如何评价假设函数h(x) 机器学习中常见的损失函数机器学习中常见的损失函数机器学习中常见的距离公式