“時至今日,推薦系統已然成了一門顯學,個性化推薦成了互聯網產品的標配。為此,我知道,好學的你肯定在收藏着朋友圈里流傳的相關文章,轉發着微博上的相關討論話題,甚至還會不斷奔走在各種大小行業會議之間,聽着大廠職工們講那些干貨。推薦系統從搜索引擎借鑒了不少技術和思想,比如內容推薦有不少技術就來自搜索引擎, 由 Amazon 發揚光大的,基於用戶( User-based )和基於物品( Item-based )的協同過濾將推薦系統技術從內容延伸到協同關系,超越了內容本身。”
這段話是摘抄自刑無刀的《推薦三十六式》,從這一段文字中你就能看出,推薦有很多技術是門外漢不了解,甚至沒聽說過的,如果你是一個程序員,你知道什么是"協同過濾"嗎?你知道推薦引擎分為幾部分嗎?現在很多沙龍,大小會議着重討論的也是推薦系統中各種復雜算法或者整個系統架構,這對於剛剛入門的我們學習起來門檻着實太高了(小紅我就是一個中年油膩程序員大叔,做了10年coding,你們看到這一定會吐槽,你一個中年油膩大叔叫他媽的什么小紅,實話告訴你們哥們也是比較無奈的,因為另一個小鮮肉博主叫了“小熊”,哥們我支能叫小紅了,這些是題外話),小紅博主都是從程序開發轉行到做數據挖據的,所以完全可以理解明白,現在那些有危機感的,亦或者想轉行做數據挖掘的你們的迷惑和迷茫,這也正是我們要開這個博客的原因。
現在機器學習培訓,深度學習培訓雖然沒有像JAVA,前端技術那樣多,但也已經比較普遍。小紅我也通過各種渠道了解和學習了其中幾家知名培訓機構的課程,課程講的都挺好的,可以說干貨滿滿(像那種打着“數據挖掘”,“深度學習”這樣名頭教python的這樣的機構不在咱們討論的范圍內啊),下面是一個培訓組織的課程安排
課程安排合理,從基礎的微積分開始講,由淺入深。相信您努力學習后一定會有收獲,但是也存在一定的問題。
問題1:如果你想做數據挖掘相關的工作,比如想以后往推薦,搜索,廣告方向發展的話,我就問一個問題,你學習的這些,“熵”,“聚類”這些算法如何在你的系統中使用?
問題2:機構培訓都教算法,理論,是否有機構講廣告,推薦架構么,據我所知,好像沒有(如果有請下面留言,謝謝)
問題3:你的系統,已經過了基於內容推薦的話,以后如何搭建,下面往哪個方向走,想了解業內比較前沿的技術和架構嗎?
問題4:現在公司面試理論面試已經不是最重要的了,以阿里2018年春季面試舉例,他們會問,
你們系統LR帶入的特征是多少維的?帶入的是幾天的特征?特征數據規模是多少G或多少T?訓練時間多長?。
這些都是在培訓機構中無法學習到的,如果你沒有做過相關工作瞎編你都編不出來。
本博客的面向人群:
1、在校學生,以后想從事數據挖掘相關行業,特別是推薦,廣告,搜索行業;
2、有着一顆不甘於平凡躁動心的程序員(典型就像小紅一樣的老程序員),帶你入門讓你少走彎路。
博客以后保持一周一更,如果小紅和小熊一段時間比較忙的話,也盡量兩周一更。
PS.
小熊博主提醒我,他是根正苗紅的數學專業出身,從事數據挖掘工作相關工作,現在在某一線大廠,不是半路出家。
轉載請注明——redbear博客