西瓜書習題偽代碼


本博客只包含3-9章代碼編程課后習題的偽代碼,僅作參考。

第三章 對數幾率回歸

3.3 編程實現對率回歸,並給出西瓜數據集3.0α上的結果

輸入:數據集3.0a
輸出:測試集上的准確率

3.4 選擇兩個 UCI 數據集,比較 10 折交叉驗證法和留一法所估計出的對率回歸的錯誤率。

3.3+數據集的改變方式

  • 留一法:
    有m個數據樣本,k折交叉驗證是把樣本划分為10等份,留一法就是k=m時的場景,即每次留1個樣本做測試集,剩余的全部做訓練集
  • 10折交叉驗證法:
    十折交叉驗證,把樣本分成10等分,在這10份數據中依次抽取一份做測試集,剩余9份做訓練集,重復10次

3.5 編輯實現線性判別分析,並給出西瓜數據集 3.0α 上的結果.

輸入:數據集3.0a
輸出:線性判別分析

第四章 決策樹

4.3 試編程實現基於信息熵進行划分選擇的決策樹算法,並為表 4.3 中數據生成一棵決策樹。

采用ID3實現決策樹,偽代碼如下:
輸入:訓練集D,屬性集A
輸出:決策樹

4.4 試編程實現基於基尼指數進行划分選擇的決策樹算法,為表 4.2 中數據生成預剪枝、后剪枝決策樹並與未剪枝決策樹進行比較.

未剪枝
輸入:訓練集D,屬性集A
輸出:決策樹

預剪枝
策略:若驗證集精度沒有提升,則不再划分
輸入:訓練集D,測試集T, 屬性集A
輸出:預剪枝后的決策樹

后剪枝
后剪枝是先從訓練集生成一顆完整的決策樹,然后自底向上地對非葉節點進行考察,若將該節點對應的子樹完全替換為葉節點能帶來決策樹繁花性的提升,則將該子樹替換為葉節點。
首先構造一個未剪枝的決策樹,而后進行如下剪枝步驟:

4.5 試編程實現基於對率回歸進行划分選擇的決策樹算法,並為表 4.3 中數據生成一棵決策樹.

很多篇博客沒有詳細說明,覺得考的優先級不是很高,暫時放在這里
有興趣可以看這篇的代碼:https://blog.csdn.net/qq_36949278/article/details/89597491

第五章 神經網絡

第六章 支持向量機

第七章 貝葉斯分類器

7.3 試編程實現拉普拉斯修正的朴素貝葉斯分類器,並以西瓜數據集3.0為訓練集,並對“測1”樣本進行分類


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM