周志華《機器學習》課后答案——第4章.決策樹


周志華老師的《機器學習》是一本非常難得的國內學者的好教材。為了好好學習,博主決定啃一啃周老師書中的課后習題。本人答案僅供參考,若有錯誤,請大神們不吝指教。(本系列文章實時更新)

1.試證明對於不含沖突數據(即特征向量完全相同但標記不同)的訓練集,必存在與訓練集一致(即訓練誤差為0)的決策樹。

答:不含沖突數據;決策樹是按照特征來進行划分->可以得到每個葉節點中的樣本的所有特征及標記完全相同的決策樹->與訓練集一致。

試析使用"最小訓練誤差"作為決策樹划分選擇准則的缺陷

答:使用"最小訓練誤差"作為決策樹划分選擇准則,由於使用的是訓練集數據,可能會將訓練特征中的一些異常或者偶然作為模型的一部分,導致過度擬合的問題。

試編程實現基於信息熵進行划分選擇的決策樹算法,並為表4.3中數據生成一棵決策樹


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM