關於JavaScript的數組隨機排序

本文轉載自查看原文 2018-09-26 22:02 3264 Javascript

昨天了解了一下Fisher–Yates shuffle費雪耶茲隨機置亂算法，現在再來看看下面這個曾經網上常見的一個寫法：

function shuffle(arr) { 
   arr.sort(function () { 
      return Math.random() - 0.5; 
   }); 
}

或者使用更簡潔的 ES6 的寫法：

function shuffle(arr) { 
 
    arr.sort(() => Math.random() - 0.5); 
 
}

但是這種寫法是有問題的，它並不能真正地隨機打亂數組。

問題

看下面的代碼，我們生成一個長度為 10 的數組['a', 'b', 'c', 'd', 'e', 'f', 'g', 'h', 'i', 'j']，使用上面的方法將數組亂序，執行多次后，會發現每個元素仍然有很大機率在它原來的位置附近出現。

let n = 10000; 
 
let count = (new Array(10)).fill(0); 

for (let i = 0; i < n; i ++) { 
 
    let arr = ['a', 'b', 'c', 'd', 'e', 'f', 'g', 'h', 'i', 'j']; 
 
    arr.sort(() => Math.random() - 0.5); 
 
    count[arr.indexOf('a')]++; 
 
} 

console.log(count);

在瀏覽器控制台中執行，輸出[ 2891, 2928, 1927, 1125, 579, 270, 151, 76, 34, 19 ](帶有一定隨機性，每次結果都不同，但大致分布應該一致)，即進行 10000 次排序后，字母'a'(數組中的第一個元素)有約 2891 次出現在第一個位置、2928 次出現在第二個位置，與之對應的只有 19 次出現在最后一個位置。如果把這個分布繪制成圖像，會是下面這樣：

類似地，我們可以算出字母'f'(數組中的第六個元素)在各個位置出現的分布為[ 312, 294, 579, 1012, 1781, 2232, 1758, 1129, 586, 317 ]，圖像如下：

如果排序真的是隨機的，那么每個元素在每個位置出現的概率都應該一樣，實驗結果各個位置的數字應該很接近，而不應像現在這樣明顯地集中在原來位置附近。因此，我們可以認為，使用形如arr.sort(() => Math.random() - 0.5)這樣的方法得到的並不是真正的隨機排序。

另外，需要注意的是上面的分布僅適用於數組長度不超過 10 的情況，如果數組更長，比如長度為 11，則會是另一種分布。比如：

function newarr(){
let a = ['a', 'b', 'c', 'd', 'e', 'f', 'g', 'h', 'i', 'j', 'k']; // 長度為11
let n = 10000; 
var count = (new Array(a.length)).fill(0); 
for (var i = 0; i < n; i ++) { 
    var arr = [].concat(a); 
    arr.sort(() => Math.random() - 0.5); 
    count[arr.indexOf('a')]++; 
} 
//console.log(count);
return count;
}

newarr();

在瀏覽器控制台中多次執行，其中第一個元素'a'的分布位置結果如下：

(11) [785, 826, 629, 652, 937, 1079, 960, 680, 617, 986, 1849]
newarr()
(11) [844, 816, 636, 665, 947, 1053, 901, 654, 661, 982, 1841]
newarr()
(11) [804, 829, 622, 655, 923, 1093, 916, 667, 591, 974, 1926]
newarr()
(11) [779, 793, 655, 713, 916, 1161, 911, 642, 579, 936, 1915]
newarr()
(11) [786, 783, 607, 653, 956, 1116, 954, 655, 619, 1028, 1843]
newarr()
(11) [867, 797, 647, 635, 943, 1056, 929, 652, 572, 977, 1925]

雖然數組長度大於10后比之前的分布更均勻，但是明顯還有問題（最后一個最大）。

分布不同的原因是 v8 引擎中針對短數組和長數組使用了不同的排序方法(下面會講)。可以看到，兩種算法的結果雖然不同，但都明顯不夠均勻。

探索

看了一下ECMAScript中關於Array.prototype.sort(comparefn)的標准，其中並沒有規定具體的實現算法，但是提到一點：

Calling comparefn(a,b) always returns the same value v when given a specific pair of values a and b as its two arguments.

也就是說，對同一組a、b的值，comparefn(a, b)需要總是返回相同的值。而上面的() => Math.random() - 0.5(即(a, b) => Math.random() - 0.5)顯然不滿足這個條件。

翻看v8引擎數組部分的源碼，注意到它出於對性能的考慮，對短數組使用的是插入排序，對長數組則使用了快速排序，至此，也就能理解為什么() => Math.random() - 0.5並不能真正隨機打亂數組排序了。(有一個沒明白的地方：源碼中說的是對長度小於等於 22 的使用插入排序，大於 22 的使用快排，但實際測試結果顯示分界長度是 10。)

解決方案

知道問題所在，解決方案也就比較簡單了。

方案一

既然(a, b) => Math.random() - 0.5的問題是不能保證針對同一組a、b每次返回的值相同，那么我們不妨將數組元素改造一下，比如將每個元素i改造為：

let new_i = { 
 
    v: i, 
 
    r: Math.random() 
 
};

即將它改造為一個對象，原來的值存儲在鍵v中，同時給它增加一個鍵r，值為一個隨機數，然后排序時比較這個隨機數：

arr.sort((a, b) => a.r - b.r);

完整代碼如下：

function shuffle(arr) { 
 
    let new_arr = arr.map(i => ({v: i, r: Math.random()})); 
 
    new_arr.sort((a, b) => a.r - b.r); 
 
    arr.splice(0, arr.length, ...new_arr.map(i => i.v)); 
 
} 
 
let a = ['a', 'b', 'c', 'd', 'e', 'f', 'g', 'h', 'i', 'j']; 
 
let n = 10000; 
 
let count = (new Array(a.length)).fill(0); 
 
for (let i = 0; i < n; i ++) { 
 
    shuffle(a); 
 
    count[a.indexOf('a')]++; 
 
} 
 
console.log(count);

一次執行結果為：[ 1023, 991, 1007, 967, 990, 1032, 968, 1061, 990, 971 ]。多次驗證，同時在這兒查看shuffle(arr)函數結果的可視化分布，可以看到，這個方法可以認為足夠隨機了。

方案二(Fisher–Yates shuffle)

需要注意的是，上面的方法雖然滿足隨機性要求了，但在性能上並不是很好，需要遍歷幾次數組，還要對數組進行splice等操作。

考察Lodash 庫中的 shuffle 算法，注意到它使用的實際上是Fisher–Yates 洗牌算法，這個算法由 Ronald Fisher 和 Frank Yates 於 1938 年提出，然后在 1964 年由 Richard Durstenfeld 改編為適用於電腦編程的版本。

function shuffle(arr) { 
 
  var i = arr.length, t, j; 
 
  while (i) { 
 
    j = Math.floor(Math.random() * i--); 
 
    t = arr[i]; 
 
    arr[i] = arr[j]; 
 
    arr[j] = t; 
 
  } 
 
} 

//對應的ES6如下
function shuffle(arr) { 
 
    let i = arr.length; 
 
    while (i) { 
 
        let j = Math.floor(Math.random() * i--);  //5555
 
        [arr[j], arr[i]] = [arr[i], arr[j]]; 
 
    } 
 
}

小結

如果要將數組隨機排序，千萬不要再用(a, b) => Math.random() - 0.5這樣的方法。目前而言，Fisher–Yates shuffle 算法應該是最好的選擇。

轉自：http://developer.51cto.com/art/201704/536457.htm

免責聲明！

本站轉載的文章為個人學習借鑒使用，本站對版權不負任何法律責任。如果侵犯了您的隱私權益，請聯系本站郵箱yoyou2525@163.com刪除。

猜您在找 js數組隨機排序 js 數組的隨機排序方法 C# 數組隨機排序 JavaScript隨機打亂數組【JavaScript】創建一個長度為10的數組，對數組填充1-100隨機數，然后冒泡排序 JavaScript中對數組的排序 JavaScript中的數組排序 JS數組sort方法與隨機排序 js將數組元素隨機排序的方法 js實現數組內元素隨機排序