原文:Coursera台大機器學習課程筆記5 -- Theory of Generalization

本章思路: 根據之前的總結,如果M很大,那么無論假設泛化能力差的概率多小,都無法忽略,所以問題轉化為證明M不大,然后上章將其轉化為證明成長函數:mh N 為多項式級別。直接證明似乎很困難,本章繼續利用轉化的思想,首先想想和mh N 相關的因素可能有哪些 不難想到目前來看只有兩個: 假設的抽樣數據集大小N break point k 這個變量確定了假設的類型 那么,由此可以得到一個函數B,給定N和k ...

2014-03-25 08:33 1 2291 推薦指數:

查看詳情

Coursera台大機器學習課程筆記6 -- The VC Dimension

本章的思路在於揭示VC Dimension的意義,簡單來說就是假設的自由度,或者假設包含的feature vector的個數(一般情況下),同時進一步說明了Dvc和,Eout,Ein以及Model ...

Mon Mar 31 00:26:00 CST 2014 0 5745
Coursera台大機器學習課程筆記3 – 機器學習的可能性

提綱: 機器學習為什么可能? 引入計算橙球概率問題 通過用Hoeffding's inequality解決上面的問題,並得出PAC的概念,證明采樣數據學習到的h的錯誤率可以和全局一致是PAC的 將得到的理論應用到機器學習,證明實際機器 ...

Sun Dec 29 05:27:00 CST 2013 2 9183
Coursera台大機器學習基礎課程學習筆記2 -- 機器學習的分類

總體思路: 各種類型的機器學習分類 按照輸出空間類型分Y 按照數據標記類型分yn 按照不同目標函數類型分f 按照不同的輸入空間類型分X 按照輸出空間類型Y,可以分為二元分類,多元分類,回歸分析以及結構化學習 ...

Tue Dec 10 07:08:00 CST 2013 0 4401
機器學習筆記:Learning Theory

  截止目前,已經知道了常用的機器學習算法是怎么回事兒、學習的步驟是怎么進行的。但在機器學習的應用背景是多種多樣的,做實際工程必須學會如何根據具體的問題評估一個學習模型的好壞,如何合理地選擇模型、提取特征,如何進行參數調優。這些也是我以前做模式識別時欠缺的環節,所以在遇到識別率很低的情況時,往往 ...

Wed Sep 12 00:26:00 CST 2012 0 3265
 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM