機器學習之蒙特卡洛方法

本文轉載自查看原文 2018-07-24 11:03 1027 機器學習

1、蒙特卡洛方法概述

　　蒙特卡羅原來是一個賭場的名稱，用它作為名字大概是因為蒙特卡羅方法是一種隨機模擬的方法，這很像賭博場里面的扔骰子的過程。最早的蒙特卡羅方法都是為了求解一些不太好求解的求和或者積分問題。比如積分：　　

　　　$\int_a^b f(x)\, dx$

　　如果此時f(x)很難求出其原函數時，那么這個積分就非常難求。當然我們可以通過蒙特卡洛方法來模擬求解近似值，假設我們的函數f(x)如下圖所示

　　則一個簡單的近似求解方法是在[a，b]之間隨機的采樣一個點。比如 $x_{0}$

$x_{0}$

　　則近似解可以表示為

$x_{0}$

$x_{0}$

　　除了正態分布之外，還有很多其他常見的連續分布也可以用均勻0-1分布來表示，不過很多時候我們的分布並不是常見的分布，這也就以為着無法通過這些轉換來獲得樣本集的概率分布。

3、接受-拒絕采樣

　　對於概率分布不是常見的分布，一個可行的辦法是采用接受-拒絕采樣來得到該分布的樣本。

　　既然 $p (x)$

$p (x)$

　　具體操作如下，設定一個方便抽樣的函數 q(x)，以及一個常量 k，使得 p(x) 總在 kq(x) 的下方。（參考上圖）

　　　　1）x 軸方向：從 q(x) 分布抽樣得到 a。

　　　　2）y 軸方向：從均勻分布（0，kq(a)) 中抽樣得到 u。

　　　　3）如果剛好落到灰色區域： u > p(a)，拒絕，否則接受這次抽樣。

　　　　4）重復以上過程。

4、小結

　　使用接受-拒絕采樣，我們可以解決一些概率分布不是常見的分布的時候，得到其采樣集並用蒙特卡羅方法求和的目的。但是接受-拒絕采樣也只能部分滿足我們的需求，在很多時候我們還是很難得到我們的概率分布的樣本集。比如：

　　　　1）對於一些二維分布 $p (x, y)$ ，有時候我們只能得到條件分布 $p (x | y)$ 一般形式，這時我們無法用接受-拒絕采樣得到其樣本集。

　　　　2）對於一些高維的復雜非常見分布 $p (x_{1}, x_{2}, . . ., x_{n})$ $p (x | y)$

本站轉載的文章為個人學習借鑒使用，本站對版權不負任何法律責任。如果侵犯了您的隱私權益，請聯系本站郵箱yoyou2525@163.com刪除。

猜您在找 機器學習回顧篇（16）：蒙特卡洛方法蒙特卡洛方法學習（一）蒙特卡洛方法學習（二）蒙特卡洛方法強化學習總結（4）--蒙特卡洛方法強化學習（二）—— 蒙特卡洛方法求解強化學習-蒙特卡洛方法蒙特卡洛蒙特卡洛模型蒙特卡洛算法