百面深度學習算法工程師帶你去面試PDF 指導探討


 深度學習再看傳統機器學習和傳統計算機程序沒有的優點,這個優點就是,能夠處理人們並不完全懂得的問題,而且更擅長處理含噪聲或不完全的數據。不能精確定義、有噪聲和數據不完全,實際生活中的場景經常是這樣的,所以說,深度學習更加貼近生活。人工神經網絡的模式匹配和學習能力使它能夠解決許多難以或不可能通過標准計算和統計方法解決的問題。

 深度學習是目前學術界和工業界都非常火熱的話題,在許多行業有着成功應用。由Hulu的近30位算法研究員和算法工程師共同編寫完成,專門針對深度學習領域,是百面機器學習的延伸。內容大致分為兩個部分,第一部分介紹經典的深度學習算法和模型,包括卷積神經網絡、循環神經網絡、圖神經網絡、生成模型、生成式對抗網絡、強化學習、元學習、自動化機器學習等;第二部分介紹深度學習在一些領域的應用,包括計算機視覺、自然語言處理、推薦系統、計算廣告、視頻處理、計算機聽覺、自動駕駛等。仍然采用知識點問答的形式來組織內容,每個問題都給出了難度級和相關知識點,以督促進行自我檢查和主動思考。每個章節精心篩選了對應領域的不同方面、不同層次上的問題,相互搭配,展示深度學習的“百面”精彩,能找到合適的內容。


《百面深度學習算法工程師帶你去面試》PDF+算法面試
《百面深度學習算法工程師帶你去面試》PDF,447頁,有書簽,文字可以復制;葫蘆娃著,諸葛越,江雲勝主編

下載:  https://pan.baidu.com/s/1xFAS_vG505JuGE-DbuisSw
提取碼: dfta

 機器會思考嗎?這樣一個簡單的問題,可以引起無窮無盡的討論-而且沒有答案。什么叫思考呢?機器會答題算不算思考?能夠答題且正確率超過人類算不算思考?能夠下棋打敗人類算不算思考?能夠自己學習進步算不算思

考?能夠騙過人算不算思考?能夠發明新東西算不算思考?思考要帶情緒嗎?做出錯誤的決定?算思考嗎?等一下,如果人做了錯誤的決定,那么他思考了嗎?如果機器和人做了同樣錯誤的決定,他們都算思考后的決定嗎?

當我們在這些問題里面越陷越深,越來越攏不到答案的時候,也許你終於認識到人的大腦實在是太強大了。人的大腦多個層次之間直覺、感性、理性同時發揮作用又有機結合。人的大腦的學習能力不是規則可以確定的.不是程序所能編寫的.也不是訓練可以達到的.連我們自己對自己的思考過程都不是特別了嘿。

深度學習正在深刻地改變這個世界。沒有深度學習,智能手機的語音識別、Web 的實時翻譯、匯率的預測都無從談起。得益於深度學習,新葯的研發、患者的診斷、汽車的自動駕駛都在漸漸成為現實。除此以外,幾乎所有的高新技術背后都有深度學習的身影。今后,世界將因深度學習而前進得更遠。

《深度學習進階自然語言處理》的主題是基於深度學習的自然語言處理。簡言之,自然語言處理是讓計算機理解我們日常所說的語言的技術。讓計算機理解我們所說的語言是一件非常難的事情,同時也非常重要。實際上,自然語言處理技術已經極大地改變了我們的生活。Web 檢索、機器翻譯、語音助理,這些對世界產生了重大影響的技術在底層都用到了自然語言處理技術。

如上所述,我們的生活已經離不開自然語言處理技術。在這個領域中,深度學習也占有非常重要的地位。實際上,深度學習極大地改善了傳統自然語言處理的性能。比如,谷歌的機器翻譯性能就基於深度學習獲得了顯著提升。
《深度學習進階自然語言處理》將圍繞自然語言處理和時序數據處理,來介紹深度學習的重要技巧,具體包括word2vec、RNN、LSTM、GRU、seq2seq 和Attention 等。
《深度學習進階自然語言處理》將盡可能地用簡潔的語言來解釋這些技術,並通過實際創建它們來幫助讀者加深理解。另外,通過實驗,我們將實際感受到它們的潛力。
《深度學習進階自然語言處理》從深度學習的視角探索自然語言處理。全書一共8 章,建議讀者像讀連載故事一樣,從頭開始順序閱讀。在遇到問題時,我們會先想辦法解決問題,然后再改進解決辦法。按照這種流程,我們以深度學習為武器,解決關於自然語言處理的各種問題。通過這次探險,希望能深入理解深度學習中的重要技巧,並體會到它們的有趣之處。沒有深度學習,智能手機的語音識別、Web 的實時翻譯、匯率的預測都無從談起。

《深度學習進階自然語言處理》中文PDF+源代碼

《深度學習進階自然語言處理》中文PDF,帶目錄,427頁,文字可復制,齋藤康毅著,陸宇傑譯。配套源代碼。
下載: https://pan.baidu.com/s/1By8rhb-lZDnBW74TG9LatQ
提取碼: tg83

我們的生活已經離不開自然語言處理技術。在這個領域中,深度學習也占有非常重要的地位。實際上,深度學習極大地改善了傳統自然語言處理的性能。比如,谷歌的機器翻譯性能就基於深度學習獲得了顯著提升。


《統計學習方法第2版》PDF+課件+源代碼
《統計學習方法第2版》PDF,484頁,帶書簽,文字可復制;配套源代碼;配套課件。
下載: https://pan.baidu.com/s/14x1P5jlYsUXbHVIB4xdiIg
提取碼: bdd2


統計學習方法即機器學習方法,是計算機及其應用領域的一門重要學科。《統計學習方法第2版》分為監督學 習和無監督學習兩篇,全面系統地介紹了統計學習的主要方法。包括感知機、k 近鄰法、朴素貝葉斯法、決策樹、邏輯斯諦回歸與最大熵模型、支持向量機、提升方法、EM 算法、隱馬爾可夫模型和條件隨機場,以及聚類方法、奇異值分解、主成分分析、潛在語義分析、概率潛在語義分析、馬爾可夫鏈蒙特卡羅法、潛在狄利克雷分配和 PageRank 算法等。除有關統計學習、監督學習和無監督學習的概論和總結的四章外,每章介紹一種方法。敘述力求從具體問題或實例入手, 由淺入深,闡明思路,給出必要的數學推導,便於掌握統計學習方法的實質,學會運用。 介紹了一些相關研究,給出了少量習題, 適用於從事文本數據挖掘、信息檢索及自然語言處理等專業的研發人員參考。

 

建議統計學習方法路線,ng課程入門,知道有哪些算法,大致怎么做,然后去kaggle打個入門賽,別做特征工程,把會的算法全用上。然后放下比賽,開始讀《統計學習方法第2版》,同時看機器學習基石或其他比較數學化的進階課程,這一步不需要你敲代碼,你要會的是滾瓜爛熟的推導,做到這一步,再去kaggle參加獎金賽,閱讀kernel,學習state of the art 模型,學習特征工程,再在學習過程中閱讀最新的論文或者經典的論文,不斷迭代這個過程,別淹死在什么機器學習實戰上,有現成的輪子不用,非得費那個勁,除非你科班畢業,代碼能力扎實,不然你能不能從頭實現一遍決策樹對你找不找到工作沒有任何一毛錢關系。筆試不會考你如何實現hmm,只會考數據結構與算法,面試只會讓你推導。

我雖然很喜歡模式識別和機器學習,但我暫時並不希望在這上面做深入的研究,只想把別人研究好的成熟的理論用在計算機視覺任務上。比如SVM,Adaboost,EM,朴素貝葉斯,K近鄰,決策樹等等。能夠知道每種算法的原理,而並不想深究其實現過程以及理論證明。比如SVM,我想知道的是這種算法如何實現分類,有哪幾種類型,每種適合什么樣的分類任務,對應的參數的意義是什么。這樣我在使用SVM-Light或者libsvm的時候就知道該怎么選用參數,怎么使用學習到的系數。從這個角度看這本書很適合我。當然也適合那些在想在機器學習方面做深入研究的人作為入門教材,我想對原理了解一二之后,閱讀大部頭或者原著肯定會輕松很多。

 《神經網絡設計第2版》中文PDF+英文PDF+代碼

《神經網絡設計第2版》中文PDF,438頁,有詳細書簽目錄,文字可以復制;英文PDF,1012頁;配套源代碼,馬丁T. 哈根著;章毅等譯.
下載: https://pan.baidu.com/s/1TNQy6TRiiDoZWgPlHV5N_A
提取碼: 83hp


《神經網絡設計書第2版》主要討論網絡結構、學習規則、訓練技巧和工程應用,緊緊圍繞“設計”這一視角組織材料和展開講解,強調基本原理和訓練方法,概念清晰,數學論述嚴謹,包含豐富的實例和練習,並配有課件和MATLAB演示程序。


內容簡介明了,直奔主題。每章都有上章回顧,也有這章總結,十分利於初次學習和看完后總結。保留了適量的數學推導,對人的理解恰到好處。數學推導學要用到微積分和線性代數,沒有其他的額外知識,例子很好,並且結合了MATLAB。每一個知識點都會舉一個例子,並且會詳細認真的推導,對知識點的理解有極大的幫助。是MATLAB神經網絡工具箱的作者,因此結合了MATLAB編程,方便學生上手實驗。

神經網絡的原理是擬合曲線,那具體怎樣擬合曲線呢?就是通過調節權值,對神經網絡最簡單直接的概括。機器學習,尤其是機器學習中的深度學習,有一個很重要的環節,應該也是最耗時間、最燒機器的環節,叫訓練模型,業內戲稱煉丹。訓練模型很重要,那主要是在干什么呢?就是調節權值,拿來一個一個的權值挨個試,找到最合適的那個,也就是前面那句文縐縐的“經驗風險最小化”,不干別的就干這個。

 


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM