Alias Method解決隨機類型概率問題(別名算法)


舉個例子,游戲中玩家推倒了一個boss,會按如下概率掉落物品:10%掉武器 20%掉飾品 30%掉戒指 40%掉披風。現在要給出下一個掉落的物品類型,或者說一個掉落的隨機序列,要求符合上述概率。

一般人會想到的兩種解法

第一種算法,構造一個容量為100(或其他)的數組,將其中10個元素填充為類型1(武器),20個元素填充為類型2(飾品)...構造完畢之后,在1到100之間取隨機數rand,取到的array[rand]對應的值,即為隨機到的類型。這種方法優點是實現簡單,構造完成之后生成隨機類型的時間復雜度就是O(1),缺點是精度不夠高,占用空間大,尤其是在類型很多的時候。

第二種就是一般的離散算法,通過概率分布構造幾個點,[10, 30, 60, 100],沒錯,后面的值就是前面依次累加的概率之和(是不是像斐波那契數列)。在生成1~100的隨機數,看它落在哪個區間,比如50在[30,60]之間,就是類型3。在查找時,可以采用線性查找,或效率更高的二分查找,時間復雜度O(logN)。

下面是第二種算法使用二分查找的實現:

<?php
class DiscreteSample
{
    private $cdf;
    private $cnt;
    public function init($pdf)
    {
        $this->cnt = count($pdf);
        if($this->cnt == 0)
            die("pdf size is empty");
        if(abs(array_sum($pdf) - 1) > 0.00001)
            die("pdf sum not equal 1, sum:".array_sum($pdf));
        $this->_pdf2cdf($pdf);
    }
    private function _pdf2cdf($pdf)
    {
        $this->cdf = $pdf;
        for ($i=1; $i < $this->cnt; $i++)
        { 
            $this->cdf[$i] += $this->cdf[$i - 1];
        }
        //因為浮點型精度問題,最后一個值強制為1
        $this->cdf[$this->cnt - 1] = 1;
    }
    public function next_rand()
    {
        $left = 0;
        $right = $this->cnt;
        $random = mt_rand() / mt_getrandmax();
        while ($left < $right - 1) 
        {
            $mid = intval(($left + $right)/2);
            if($mid - 1 >= $this->cnt) break;
            if($random > $this->cdf[$mid - 1])
                $left = $mid;
            else
                $right = $mid;
        }
        return $left;
    }
}
?>

Alias Method(別名方法)

別名算法最終的結果是要構造拼裝出一個每一列合都為1的矩形,若每一列最后都要為1,那么要將所有元素都乘以4(概率類型的數量)

此時會有概率大於1的和小於1的,接下來就是構造出某種算法用大於1的補足小於1的,使每種概率最后都為1,注意,這里要遵循一個限制:每列至多是兩種概率的組合。

最終,我們得到了兩個數組,一個是在下面原始的prob數組[0.4,0.8,0.6,1],另外就是在上面補充的Alias數組,其值代表填充的那一列的序號索引,(如果這一列上不需填充,那么就是NULL),[3,4,4,NULL]。當然,最終的結果可能不止一種,你也可能得到其他結果。

等等,這個問題還沒有解決,得到這兩個數組之后,隨機取其中的一列,比如是第三列,讓prob[3]的值與一個隨機小數f比較,如果f小於prob[3],那么結果就是3,否則就是Alias[3],即4。

我們可以來簡單驗證一下,比如隨機到第三列的概率是1/4,得到第三列下半部分的概率為1/4*3/5,記得在第一列還有它的一部分,那里的概率為1/4*(1-2/5),兩者相加最終的結果還是3/10,符合原來的pdf概率。這種算法初始化較復雜,但生成隨機結果的時間復雜度為O(1),是一種性能非常好的算法。

代碼示例

<?php
class AliasMethod
{
    private $length;
    private $prob_arr;
    private $alias;
 
    public function __construct ($pdf)
    {
        $this->length = 0;
        $this->prob_arr = $this->alias = array();
        $this->_init($pdf);
    }
    private function _init($pdf)
    {
        $this->length = count($pdf);
        if($this->length == 0)
            die("pdf is empty");
        if(array_sum($pdf) != 1.0)
            die("pdf sum not equal 1, sum:".array_sum($pdf));
 
        $small = $large = array();
        for ($i=0; $i < $this->length; $i++) 
        { 
            $pdf[$i] *= $this->length;
            if($pdf[$i] < 1.0)
                $small[] = $i;
            else
                $large[] = $i;
        }
 
        while (count($small) != 0 && count($large) != 0) 
        {
            $s_index = array_shift($small);
            $l_index = array_shift($large);
            $this->prob_arr[$s_index] = $pdf[$s_index];
            $this->alias[$s_index] = $l_index;
 
            $pdf[$l_index] -= 1.0 - $pdf[$s_index];
            if($pdf[$l_index] < 1.0)
                $small[] = $l_index;
            else
                $large[] = $l_index;
        }
 
        while(!empty($small))
            $this->prob_arr[array_shift($small)] = 1.0;
        while (!empty($large))
            $this->prob_arr[array_shift($large)] = 1.0;
    }
    public function next_rand()
    {
        $column = mt_rand(0, $this->length - 1);
        return mt_rand() / mt_getrandmax() < $this->prob_arr[$column] ? $column : $this->alias[$column];
    }
}
?>

 


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM