答案均為轉載,應怕原鏈接失效,所以粘貼了一下內容,答案尾部附上原鏈接
《南瓜書》https://github.com/datawhalechina/pumpkin-book/releases
第一章:緒論
答案1:
第一章
1.版本空間:
(1)色澤=青綠 根蒂=蜷縮 敲聲=濁響
(2)色澤=青綠 根蒂=蜷縮 敲聲=*
(3)色澤=青綠 根蒂=* 敲聲=濁響
(4)色澤=* 根蒂=蜷縮 敲聲=濁響
(5)色澤=青綠 根蒂=* 敲聲=*
(6)色澤=* 根蒂=蜷縮 敲聲=*
(7)色澤=* 根蒂=* 敲聲=濁響
2.析合范式即多個合取式的析取。
表1.1包含3種屬性,它的假設空間大小為3×4×4+1=49
考慮冗余情況:
具體假設 2×3×3=18種
一個屬性泛化假設 2×3+3×3+2×3=21種
兩個屬性泛化假設 2+3+3=8種
三個屬性泛化假設 1種
不考慮冗余、空集的情況下k最大取值為48,考慮冗余的情況下k最大取值為18
k=1時,共48種
k=18時,共1種
k取中間值,比較復雜。
3.(1)最簡單的設計:訓練樣本一致特征越多越好,即一致性比例越高越好,為歸納偏好。考慮歸納偏好應盡量與問題相匹配,所以可使歸納偏好與噪聲分布相匹配。
(2)通常認為兩個數據的屬性越相近,則更傾向於將他們分為同一類。若相同屬性出現了兩種不同的分類,則認為它屬於與他最臨近幾個數據的屬性。也可以考慮同時去掉所有具有相同屬性而不同分類的數據,留下的數據就是沒誤差的數據,但是可能會丟失部分信息。
5.消息推送,如廣告推薦;網站排名;圖片搜索。
————————————————
版權聲明:本文為CSDN博主「你--傻不傻」的原創文章,遵循CC 4.0 BY-SA版權協議,轉載請附上原文出處鏈接及本聲明。
原文鏈接:https://blog.csdn.net/weixin_43260483/article/details/83750544
答案2:
答案3:
此答案較為復雜,適合二刷時再看
https://blog.csdn.net/ytikewk/article/details/99745137
第二章:
答案一:
答案二: