周志华《机器学习》课后答案——第4章.决策树


周志华老师的《机器学习》是一本非常难得的国内学者的好教材。为了好好学习,博主决定啃一啃周老师书中的课后习题。本人答案仅供参考,若有错误,请大神们不吝指教。(本系列文章实时更新)

1.试证明对于不含冲突数据(即特征向量完全相同但标记不同)的训练集,必存在与训练集一致(即训练误差为0)的决策树。

答:不含冲突数据;决策树是按照特征来进行划分->可以得到每个叶节点中的样本的所有特征及标记完全相同的决策树->与训练集一致。

试析使用"最小训练误差"作为决策树划分选择准则的缺陷

答:使用"最小训练误差"作为决策树划分选择准则,由于使用的是训练集数据,可能会将训练特征中的一些异常或者偶然作为模型的一部分,导致过度拟合的问题。

试编程实现基于信息熵进行划分选择的决策树算法,并为表4.3中数据生成一棵决策树


免责声明!

本站转载的文章为个人学习借鉴使用,本站对版权不负任何法律责任。如果侵犯了您的隐私权益,请联系本站邮箱yoyou2525@163.com删除。



 
粤ICP备18138465号  © 2018-2025 CODEPRJ.COM