斯坦福大學Andrew Ng教授主講的《機器學習》公開課觀后感


課程設置和內容 
視頻課程分為20集,每集72-85分鍾。實體課程大概一周2次,中間還穿插助教上的習題課,大概一個學期的課程。 

內容涉及四大部分,分別是:監督學習(2-8集)、學習理論(9集-11集)、無監督學習(12-15集)、強化學習(16-20集)。監督學習和無監督學習,基本上是機器學習的二分法;強化學習位於兩者之間;而學習理論則從總體上介紹了如何選擇、使用機器學習來解決實際問題,以及調試(比如:誤差分析、銷蝕分析)、調優(比如:模型選擇、特征選擇)的各種方法和要注意的事項(比如,避免過早優化)。 

監督學習,介紹了回歸、朴素貝葉斯、神經網絡、SVM(支持向量機)、SMO(順序最小優化)算法等;無監督學習講了聚類、K-means、GMM(混合高斯模型)、EM算法 、PCA(主成分分析)、LSI(潛在語義索引)、SVD(奇異值分解)、ICA(獨立成分分析)等;強化學習主要講了這類連續決策學習(馬爾科夫決策過程,MDP)中的值迭代(VI)和策略迭代(PI),以及如何定義回報函數,如何找到最佳策略等問題。 

授課方式 
網上有老師的講義,可以在網易這門課的主頁面上打包下載(網址http://v.163.com/special/opencourse/machinelearning.html)。老師基本上是寫板書的,PPT是輔助。在黑板上用粉筆邊講解邊書寫,有助於帶動學生的思考,使師生之間有交流有互動。個人以為,比直接顯示PPT效果好。數學公式的推導很費時間,課堂上也不可能大多數的時間用來推導公式,所以大量的推導老師要求學生在課下看講義,或者通過習題課聽助教講解。 

授課語言 
因為是美國的課堂,當然的教學語言是英語。網易做的不錯,除了把老師說的話全部轉寫下來,還做了中文翻譯,前14集翻譯得不錯,除了偶有錯別字之外,專業術語翻譯的很好,語句也很流暢。第15集以后一直到最后一堂課,翻譯的不是太准確,一些專業術語都翻譯錯了,很讓觀者感到不適。但是,無論如何,還是感謝網易這些轉寫和翻譯的無名網友無私的付出。這些小的瑕疵不會讓真正熱愛這門課程的學習者放棄學習,反而想加入翻譯者的隊伍,為傳播科學知識而貢獻力量呢。 

觀后感 
總體感覺,老師講的不錯,是個真正懂機器學習的人。老師在課上也說過,很容易區分那些真正懂機器學習的人,和那些只會紙上談兵的人。我希望成為第一類,並為此努力着。 

老師是華裔,中文名字叫吳恩達,生於倫敦,看上去很親切。課堂很活躍,老師注重和學生交流,每講完一個主題,會問學生有問題嗎,然后一一作答。 

視頻大概錄制於2007年(個人推測,未經考證),內容上,與現在的機器學習技術比,稍微顯得不夠多。近年來,機器學習領域有了長足的發展,學術界和工業界齊發力,二者相互促進,達到了前所未有的高度。即便是曾經沉寂的神經網絡,近年來也改頭換面成了深度學習。不過,從專家的角度看,這不是一種新的機器學習技術,它只是涉及到其中的一個環節——特征選擇,並不構成一個獨立的學習方法。 

老師沒有涉及實戰。受限於課堂講授的方式和時間上的限制,課上只能做必要知識點的講解。 

數學公式比較多,似懂非懂的。如果不滿足於“知其然”,還要“知其所以然”,以后的方向是搞模型、算法研究的話,那還要補習一下數學知識,必須的。如果僅是為了解決實際問題,對算法要求不高的話,那知道如何運用就夠了。剩下的,隨着應用系統的不斷進展,對整個系統各方面要求的提高,那時會倒逼你進階的。 

遺憾的是,因為沒有完全掌握,所以再回看已經看過的視頻,還是似懂非懂,但是比第一次要好很多。建議大家多看幾遍,加強練習,跟自己的項目相結合,動手實現會加深理解。“精通的目的全在於應用”(毛語),機器學習只是工具,應用到解決實際問題上才能真正體現它的價值。 

跟這個課程最接近的,是加州理工學院的《機器學習與數據挖掘》(18集)(網址http://v.163.com/special/opencourse/learningfromdata.html),主講老師有口音,很重,如果沒有中文字幕的幫助,很難快速掌握。目前網易的進展是,翻譯完了前4集。 

順便說一句,以后想練專業口語的話,可以多看Andrew Ng這個,跟着說,以后在國際會議上就能充分表達了。聽加州理工的這個,也能聽懂那些非英語母語國家講的英語了。不同的地方有不同的英語口音,我們還不算難聽的,應該算是好聽的,呵呵。 

又及,自己心里暗想,土鱉也能“准”“海歸”一回。網絡帶來了革命,網絡也給我們這些愛學習的人帶來了真正“免費的午餐”。其實,話說回來,就像免費的搜索引擎一樣,他們收獲的是更大的名聲上的勝利,擴大了影響,傳播了美譽。像耶魯大學的一個教授的一句玩笑話,其目的是爭取“世界學術霸權”。 

Andrew Ng教授的《機器學習》公開課視頻(30集) 
http://openclassroom.stanford.edu/MainFolder/CoursePage.php?course=MachineLearning 

Andrew Ng教授的Deep Learning維基,有中文翻譯 
http://deeplearning.stanford.edu/wiki/index.php/UFLDL_Tutorial 

其他教學資源 
韓家煒教授在北大的《數據挖掘》暑期班視頻,英文PPT,中文講解(22集) 
http://v.youku.com/v_show/id_XMzA3NDI5MzI=.html(視頻:01數據挖掘概念,課程簡介,數據庫技術發展史,數據挖掘應用) 

韓家煒教授(UIUC大學)的《數據挖掘》在線課程 
https://wiki.engr.illinois.edu/display/cs412/Home;jsessionid=6BF0A2C36A95A31D2DA754A017756F4B 

卡內基•梅隆大學(CMU)的《機器學習》在線課程 
http://www.cs.cmu.edu/~epxing/Class/10701/lecture.html 

麻省理工學院(MIT)的《機器學習》在線課程 
http://ocw.mit.edu/courses/electrical-engineering-and-computer-science/6-867-machine-learning-fall-2006/index.htm 

加州理工學院(Caltech)的《機器學習與數據挖掘》在線課程 
http://work.caltech.edu/telecourse.html(同上述網易公開課http://v.163.com/special/opencourse/learningfromdata.html) 

UC Irvine的《機器學習與數據挖掘》在線課程 
http://sli.ics.uci.edu/Classes/2011W-178 

斯坦福大學的《數據挖掘》在線課程 
http://www.stanford.edu/class/stats202/ 

其他資源 
北京機器學習讀書會 
http://q.weibo.com/1644133 

機器學習相關電子書 
http://t.cn/zjtPuCS(打開artificial intelligence找子目錄machine learning) 

附: 
主講教師介紹:(新浪公開課:機器學習http://open.sina.com.cn/course/id_280/) 
講師:Andrew Ng 
學校:斯坦福 
斯坦福大學計算機系副教授,人工智能實驗室主任,致力於人工智能、機器學習,神經信息科學以及機器人學等研究方向。他和他的學生成功開發出新的機器視覺算法,大大簡化了機器人的傳感器系統。 

【原文鏈接:http://liliphd.iteye.com/blog/1929358】


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM