周志華老師的《機器學習》是一本非常難得的國內學者的好教材。為了好好學習,博主決定啃一啃周老師書中的課后習題。本人答案僅供參考,若有錯誤,請大神們不吝指教。(本系列文章實時更新)
1.試證明對於不含沖突數據(即特征向量完全相同但標記不同)的訓練集,必存在與訓練集一致(即訓練誤差為0)的決策樹。
答:不含沖突數據;決策樹是按照特征來進行划分->可以得到每個葉節點中的樣本的所有特征及標記完全相同的決策樹->與訓練集一致。
試析使用"最小訓練誤差"作為決策樹划分選擇准則的缺陷
答:使用"最小訓練誤差"作為決策樹划分選擇准則,由於使用的是訓練集數據,可能會將訓練特征中的一些異常或者偶然作為模型的一部分,導致過度擬合的問題。