原文:Coursera台大機器學習課程筆記4 -- Training versus Testing

這節的主題感覺和training,testing關系不是很大,其根本線索在於鋪墊並求解一個問題: 為什么算法PLA可以正確的work 因為前面的知識告訴我們,只有當假設的個數有限的時候,我們才能比較確認我們得到壞的數據集的概率比較低,也就是說算法得出的假設和最佳假設在全局表現相同 錯誤率相等 ,可是PLA的假設是平面上的直線,不是無數個么 為什么可以正常泛化 為解釋這個問題,有了這節以及下面幾節 ...

2014-03-12 12:29 0 2465 推薦指數:

查看詳情

Coursera台大機器學習課程筆記5 -- Theory of Generalization

本章思路: 根據之前的總結,如果M很大,那么無論假設泛化能力差的概率多小,都無法忽略,所以問題轉化為證明M不大,然后上章將其轉化為證明成長函數:mh(N)為多項式級別。直接證明似乎很困難,本章繼續利 ...

Tue Mar 25 16:33:00 CST 2014 1 2291
Coursera台大機器學習課程筆記6 -- The VC Dimension

本章的思路在於揭示VC Dimension的意義,簡單來說就是假設的自由度,或者假設包含的feature vector的個數(一般情況下),同時進一步說明了Dvc和,Eout,Ein以及Model ...

Mon Mar 31 00:26:00 CST 2014 0 5745
Coursera台大機器學習基礎課程學習筆記2 -- 機器學習的分類

總體思路: 各種類型的機器學習分類 按照輸出空間類型分Y 按照數據標記類型分yn 按照不同目標函數類型分f 按照不同的輸入空間類型分X 按照輸出空間類型Y,可以分為二元分類,多元分類,回歸分析以及結構化學習 ...

Tue Dec 10 07:08:00 CST 2013 0 4401
Coursera台大機器學習課程筆記3 – 機器學習的可能性

提綱: 機器學習為什么可能? 引入計算橙球概率問題 通過用Hoeffding's inequality解決上面的問題,並得出PAC的概念,證明采樣數據學習到的h的錯誤率可以和全局一致是PAC的 將得到的理論應用到機器學習,證明實際機器 ...

Sun Dec 29 05:27:00 CST 2013 2 9183
 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM