面試前端必須准備的一個問題:怎樣去掉Javascript的Array的重復項。據我所知,百度、騰訊、盛大等都在面試里出過這個題目。 這個問題看起來簡單,但是其實暗藏殺機。 考的不僅僅是實現這個功能,更能看出你對計算機程序執行的深入理解。
我總共想出了三種算法來實現這個目的:
第一種辦法:
Array.prototype.unique1 = function() { var n = []; //一個新的臨時數組 for(var i = 0; i < this.length; i++) //遍歷當前數組 { //如果當前數組的第i已經保存進了臨時數組,那么跳過, //否則把當前項push到臨時數組里面 if (n.indexOf(this[i]) == -1) n.push(this[i]); } return n; }
第二種辦法:
Array.prototype.unique2 = function() { var n = {},r=[]; //n為hash表,r為臨時數組 for(var i = 0; i < this.length; i++) //遍歷當前數組 { if (!n[this[i]]) //如果hash表中沒有當前項 { n[this[i]] = true; //存入hash表 r.push(this[i]); //把當前數組的當前項push到臨時數組里面 } } return r; }
第三種辦法:
Array.prototype.unique3 = function() { var n = [this[0]]; //結果數組 for(var i = 1; i < this.length; i++) //從第二項開始遍歷 { //如果當前數組的第i項在當前數組中第一次出現的位置不是i, //那么表示第i項是重復的,忽略掉。否則存入結果數組 if (this.indexOf(this[i]) == i) n.push(this[i]); } return n; }
其中第1種和第3種方法都用到了數組的indexOf方法。此方法的目的是尋找存入參數在數組中第一次出現的位置。很顯然,js引擎在實現這個方法的時候會遍歷數組直到找到目標為止。所以此函數會浪費掉很多時間。 而第2中方法用的是hash表。把已經出現過的通過下標的形式存入一個object內。下標的引用要比用indexOf搜索數組快的多。
為了判斷這三種方法的效率如何,我做了一個測試程序,生成一個10000長度的隨機數組成的數組,然后分別用幾個方法來測試執行時間。 結果表明第二種方法遠遠快於其他兩種方法。 但是內存占用方面應該第二種方法比較多,因為多了一個hash表。這就是所謂的空間換時間。
第四種方法:
Array.prototype.unique4 = function()
{
this.sort(); var re=[this[0]]; for(var i = 1; i < this.length; i++) { if( this[i] !== re[re.length-1]) { re.push(this[i]); } } return re; }
這個方法的思路是先把數組排序,然后比較相鄰的兩個值。 排序的時候用的JS原生的sort方法,JS引擎內部應該是用的快速排序吧。 最終測試的結果是此方法運行時間平均是第二種方法的三倍左右,不過比第一種和第三種方法快了不少。
第五種辦法:利用ES6中的Ser()key的集合去重 (確保瀏覽器支持ES6規范)
Array.prototype.unique5 = function () { //測試瀏覽器是否支持ES6 var m = new Map(); var s = new Set(); alert('你的瀏覽器支持Map和Set!'); //創建2個示例數組 var arr1 = [1,2,3,4,5]; var arr2 = [1,3,5,7,9]; //創建一個空數組 //用於存儲去重結果 var arr3 = []; //將arr1和arr2合並,並且用Set()存儲,進行去重; var s = Set( arr1.concat ( arr2 ) ); //遍歷s,並且執行事件; s.forEach( function (e){ //將s的內容添加到arr3中,即是去重結果; arr3.push(e); }) return arr3; }
第五種方法所用的Set()是ES6的新內容,想要了解更多點擊傳送門;