假定假设函数为一个二次函数,只是参数未定:
每给定一个样本大小,就能训练出对应的假设函数,从而利用这个假设函数可以计算出Jtrain(仍然在之前拿来训练的那些样本里面),然后将训练好的假设函数用在全部的验证集上可以计算出Jcv(注意在计算准确率的时候就不必λ了)。
则代价与训练样本的个数之间的关系为:
1、高偏差情形
可以看出:即使训练样本很多也无济于事,必须更改模型以解决本质问题。
2、高方差情形
可以看出:增加训练样本个数对应过拟合情形来说是有效果的。
假定假设函数为一个二次函数,只是参数未定:
每给定一个样本大小,就能训练出对应的假设函数,从而利用这个假设函数可以计算出Jtrain(仍然在之前拿来训练的那些样本里面),然后将训练好的假设函数用在全部的验证集上可以计算出Jcv(注意在计算准确率的时候就不必λ了)。
则代价与训练样本的个数之间的关系为:
可以看出:即使训练样本很多也无济于事,必须更改模型以解决本质问题。
可以看出:增加训练样本个数对应过拟合情形来说是有效果的。
本站转载的文章为个人学习借鉴使用,本站对版权不负任何法律责任。如果侵犯了您的隐私权益,请联系本站邮箱yoyou2525@163.com删除。