理論介紹
什么是分類
- 分類屬於機器學習中監督學習的一種。模型的學習在被告知每個訓練樣本屬於哪個類的“指導”下進行,新數據使用訓練集中得到的規則進行分類。

分類的步驟




什么是決策樹

決策樹歸納




信息增益
相關理論基礎

計算公式

ID3




注:生成的決策樹有誤,fair對應的應該是yes,excellent對應的應該是no
C4.5

python實現
- GitHub地址
- 不足之處:目前只能處理離散值,並且還沒有添加從文件中讀取數據集的功能。但是基本上算法的大部分都實現了,以后到了具體應用場景時可以繼續調整后使用。
參考資料
- 理論部分參考:福州大學數學與計算機科學學院蘇雅茹老師數據挖掘課上使用的課件(一並上傳到Github了,課件內還包括其他一些常用分類算法,例如貝葉斯算法)
- 代碼部分參考:Python實現C4.5(信息增益率)
- 如有侵權,請聯系我刪除
