PHP 的 uniqid 函數產生的 id 真的是唯一的么?


PHP 的 uniqid 函數產生的 id 真的是唯一的么?

最近使用到了 uniqid,就產生了疑問?uniqid 生成的 id 由什么組成?真的是唯一的么?什么情況下會產生沖突?

從文檔中看到 uniqid 函數有兩個參數

uniqid 的結構

看源碼:

PHP_FUNCTION(uniqid)
{
    ...
	gettimeofday((struct timeval *) &tv, (struct timezone *) NULL);
	sec = (int) tv.tv_sec;
	usec = (int) (tv.tv_usec % 0x100000);

    ...
	if (more_entropy) {
		uniqid = strpprintf(0, "%s%08x%05x%.8F", prefix, sec, usec, php_combined_lcg() * 10);
	} else {
		uniqid = strpprintf(0, "%s%08x%05x", prefix, sec, usec);
	}

	RETURN_STR(uniqid);
}

基本就了解清楚了。uniqid 是由四個部分組成:

prefix + sec + usec + “.” + php_combined_lcg

其中 prefix 就是 uniqid 函數的第一個參數。它是一個字符串,傳遞進來什么,就直接返回什么。

sec 是當前時鍾的秒,usec 是毫秒,這兩個值都是從 gettimeofday 獲取的。換句話說,只要在一台機器上,兩個 php 程序在同一個毫秒內獲取的 sec 和 usec 是一樣的。

php_combined_lcg 是 uniqid 的第二個參數決定的,它是一個墒值,它是使用線性同余生成一個 0 ~ 1 之間的隨機數。如果第二個參數為 true,就有這個值,如果第二個參數為 false,就沒有這個值。

比如:

➜  ~ php -r 'echo uniqid("my_", true);'
my_5afe9b414c2141.76621929

結論

所以說,如果我們單純使用 uniqid() 這個方法,不帶任何參數的話,這個方法只能保證單個進程,在同一個毫秒內是唯一的。如果使用uniqid("", true)。 帶了一個墒值,自身已經有一個隨機的方式能保證生成的id的隨機性了。但是由於線性同余是比較簡單的生成隨機數的算法,隨機性有可能還不夠,所以,網上流傳的一種更隨機數值的方式是:

uniqid(mt_rand(), true)

其中 mt_rand() 生成隨機數就不是使用線性同余生成隨機數的方式了,而是使用 Mersenne Twister Random Number Generator (梅森旋轉算法)。換句話說,上面這個 id 由兩種隨機算法 + 時間戳生成。基本上,這個算法在很大程度上能保證唯一性了(如果要問沖突率的話,估計只有數學系學生能研究出來了...)。

上面的這個給出的id會有一個點號,而且長度並不是128bit。如果希望生成uuid,就需要一個hash,不管是md5,sha1 都是可以選擇的。所以網上又有一種生成唯一碼的方式。

md5(uniqid(mt_rand(), true))

但是,本質上,這兩種方式的隨機性是相等的。


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM