本章思路: 根據之前的總結,如果M很大,那么無論假設泛化能力差的概率多小,都無法忽略,所以問題轉化為證明M不大,然后上章將其轉化為證明成長函數:mh(N)為多項式級別。直接證明似乎很困難,本章繼續利 ...
提綱: 機器學習為什么可能 引入計算橙球概率問題 通過用Hoeffding s inequality解決上面的問題,並得出PAC的概念,證明采樣數據學習到的h的錯誤率可以和全局一致是PAC的 將得到的理論應用到機器學習,證明實際機器是可以學習 機器學習的大多數情況下是讓機器通過現有的訓練集 D 的學習以獲得預測未知數據的能力,即選擇一個最佳的h做為學習結果,那么這種預測是可能的么 為什么在采樣數據 ...
2013-12-28 21:27 2 9183 推薦指數:
本章思路: 根據之前的總結,如果M很大,那么無論假設泛化能力差的概率多小,都無法忽略,所以問題轉化為證明M不大,然后上章將其轉化為證明成長函數:mh(N)為多項式級別。直接證明似乎很困難,本章繼續利 ...
本章的思路在於揭示VC Dimension的意義,簡單來說就是假設的自由度,或者假設包含的feature vector的個數(一般情況下),同時進一步說明了Dvc和,Eout,Ein以及Model ...
這節的主題感覺和training,testing關系不是很大,其根本線索在於鋪墊並求解一個問題: 為什么算法PLA可以正確的work?因為前面的知識告訴我們,只有當假設的個 ...
總體思路: 各種類型的機器學習分類 按照輸出空間類型分Y 按照數據標記類型分yn 按照不同目標函數類型分f 按照不同的輸入空間類型分X 按照輸出空間類型Y,可以分為二元分類,多元分類,回歸分析以及結構化學習 ...
最近在跟台大的這個課程,覺得不錯,想把學習筆記發出來跟大家分享下,有錯誤希望大家指正。 一機器學習是什么? 感覺和 Tom M. Mitchell的定義幾乎一致, A computer program is said to learn from experience E ...
在上周我寫了一篇“基於機器學習的銀行電話營銷客戶購買可能性預測分析”,那是作為對客戶購買可能性預測分析的第一次驗證案例的嘗試。今天是基於機器學習的客戶購買可能性預測分析的第二次驗證案例:推薦系統。 推薦系統 基於熱度推薦:由專家或者一定時期產品銷售情況或者主推產品,制作一個排行榜,在沒有用 ...
注:本大綱和筆記是根據台大林軒田老師《機器學習基石》和《機器學習技法》視頻課程整理而來。林老師講課幽默風趣,授課內容豐富而又通透,解決了我作為初學者的很多困惑,對此我非常感激。關於林老師的視頻課程和相關資料,可參考這里。另外,個人認為,這里面講解的最最精彩的是SVM和機器學習的可行性這兩部分 ...
7 Support Vector Machines7.1 Large Margin Classification7.1.1 Optimization Objective支持向量機(SVM)代價函數在數 ...