今天看到這篇文章里面提到如何選擇模型,覺得非常好,單獨寫在這里。
更多的機器學習實戰可以看這篇文章:http://www.cnblogs.com/charlesblc/p/6159187.html
另外關於機器學習與數據挖掘的區別,
參考這篇文章:https://www.zhihu.com/question/30557267
數據挖掘:也就是data mining,是
一個很寬泛的概念。字面意思就是從成噸的數據里面挖掘有用的信息。這個工作
BI(商業智能)可以做,
數據分析可以做,甚至
市場運營也可以做。你用excel分析分析數據,發現了一些有用的信息,然后這些信息可以指導你的business,恭喜你,你已經會數據挖掘了。
機器學習:machine learning,是計算機科學和統計學的交叉學科,基本目標是學習一個x->y的函數(映射),來做 分類或者 回歸的工作。之所以經常和數據挖掘合在一起講是 因為現在好多數據挖掘的工作是通過機器學習提供的算法工具實現的,
機器學習:machine learning,是計算機科學和統計學的交叉學科,基本目標是學習一個x->y的函數(映射),來做 分類或者 回歸的工作。之所以經常和數據挖掘合在一起講是 因為現在好多數據挖掘的工作是通過機器學習提供的算法工具實現的,
例如
廣告的ctr預估,PB級別的點擊日志在通過典型的機器學習流程可以得到一個預估模型,從而提高互聯網廣告的點擊率和回報率;
個性化推薦,還是通過機器學習的一些算法分析平台上的各種購買,瀏覽和收藏日志,得到一個推薦模型,來預測你喜歡的商品。
深度學習:deep learning,機器學習里面現在比較火的一個topic(大坑),本身是 神經網絡算法的衍生,在圖像,語音等富媒體的分類和識別上取得了非常好的效果,所以各大研究機構和公司都投入了大量的人力做相關的研究和開發。
總結下, 數據挖掘是個很寬泛的概念,數據挖掘常用方法大多來自於機器學習這門學科,深度學習是機器學習一類比較火的算法,本質上還是原來的神經網絡。
深度學習:deep learning,機器學習里面現在比較火的一個topic(大坑),本身是 神經網絡算法的衍生,在圖像,語音等富媒體的分類和識別上取得了非常好的效果,所以各大研究機構和公司都投入了大量的人力做相關的研究和開發。
總結下, 數據挖掘是個很寬泛的概念,數據挖掘常用方法大多來自於機器學習這門學科,深度學習是機器學習一類比較火的算法,本質上還是原來的神經網絡。
另外關於深度學習,可以看下面這個系列