原文:(數據科學學習手札30)朴素貝葉斯分類器的原理詳解&Python與R實現

一 簡介 要介紹朴素貝葉斯 naive bayes 分類器,就不得不先介紹貝葉斯決策論的相關理論: 貝葉斯決策論 bayesian decision theory 是概率框架下實施決策的基本方法。對分類任務來說,在所有相關概率都已知的理想情況下,貝葉斯決策論考慮如何基於這些概率和誤判損失來選擇最優的類別標記結果。 二 貝葉斯決策論的基本原理 我們以多分類任務為例: 假設有N種可能的類別標記,即y ...

2018-05-03 10:57 0 2451 推薦指數:

查看詳情

數據科學學習手札26)隨機森林分類器原理詳解&PythonR實現

一、簡介   作為集成學習中非常著名的方法,隨機森林被譽為“代表集成學習技術水平的方法”,由於其簡單、容易實現、計算開銷小,使得它在現實任務中得到廣泛使用,因為其來源於決策樹和bagging,決策樹我在前面的一篇博客中已經詳細介紹,下面就來簡單介紹一下集成學習與Bagging; 二、集成 ...

Sat Apr 14 04:04:00 CST 2018 0 6244
數據科學學習手札24)邏輯回歸分類器原理詳解&PythonR實現

一、簡介   邏輯回歸(Logistic Regression),與它的名字恰恰相反,它是一個分類器而非回歸方法,在一些文獻里它也被稱為logit回歸、最大熵分類器(MaxEnt)、對數線性分類器等;我們都知道可以用回歸模型來進行回歸任務,但如果要利用回歸模型來進行分類該怎么辦呢?本文介紹的邏輯 ...

Thu Apr 12 22:44:00 CST 2018 1 2907
數據科學學習手札29)KNN分類原理詳解&PythonR實現

一、簡介   KNN(k-nearst neighbors,KNN)作為機器學習算法中的一種非常基本的算法,也正是因為其原理簡單,被廣泛應用於電影/音樂推薦等方面,即有些時候我們很難去建立確切的模型來描述幾種類別的具體表征特點,就可以利用天然的臨近關系來進行分類; 二、原理   KNN ...

Thu Apr 26 06:11:00 CST 2018 0 1109
數據科學學習手札23)決策樹分類原理詳解&PythonR實現

  作為機器學習中可解釋性非常好的一種算法,決策樹(Decision Tree)是在已知各種情況發生概率的基礎上,通過構成決策樹來求取凈現值的期望值大於等於零的概率,評價項目風險,判斷其可行性的決策分析方法,是直觀運用概率分析的一種圖解法。由於這種決策分支畫成圖形很像一棵樹的枝干,故稱決策樹 ...

Fri Apr 06 22:47:00 CST 2018 0 1726
數據科學學習手札34)多層感知機原理詳解&PythonR實現

一、簡介   機器學習分為很多個領域,其中的連接主義指的就是以神經元(neuron)為基本結構的各式各樣的神經網絡,規范的定義是:由具有適應性的簡單單元組成的廣泛並行互連的網絡,它的組織能夠模擬生物神經系統對真實世界的刺激作出的交互反應。而我們在機器學習中廣泛提及的神經網絡學習就是機器學習 ...

Tue May 08 04:09:00 CST 2018 0 2707
數據科學學習手札13)K-medoids聚類算法原理簡介&PythonR實現

前幾篇我們較為詳細地介紹了K-means聚類法的實現方法和具體實戰,這種方法雖然快速高效,是大規模數據聚類分析中首選的方法,但是它也有一些短板,比如在數據集中有臟數據時,由於其對每一個類的准則函數為平方誤差,當樣本數據中出現了不合理的極端值,會導致最終聚類結果產生一定的誤差,而本篇將要介紹 ...

Sun Mar 18 23:17:00 CST 2018 12 12391
 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM