lodash源碼分析之數組的差集


外部世界那些破舊與貧困的樣子,可以使我內心世界得到平衡。

——卡爾維諾《煙雲》

本文為讀 lodash 源碼的第十七篇,后續文章會更新到這個倉庫中,歡迎 star:pocket-lodash

gitbook也會同步倉庫的更新,gitbook地址:pocket-lodash

作用與用法

baseDifference 可以用來獲取指定數組與另一個數組的差集。

這個函數是內部函數,是后面實現其它比較函數的核心函數。

baseDifference 的方法簽名如下:

baseDifference(array, values, iteratee, comparator)

第一和第二個參數是需要比較的兩個數組;iteratee 可以返回一值映射值,比較時,可以使用映射的值來進行比較; comparator 是自定義比較函數,如果有傳遞,則調用自定義的比較函數來進行交集的比較。

依賴

import SetCache from './SetCache.js'
import arrayIncludes from './arrayIncludes.js'
import arrayIncludesWith from './arrayIncludesWith.js'
import map from '../map.js'
import cacheHas from './cacheHas.js'

lodash源碼分析之緩存使用方式的進一步封裝

lodash源碼分析之arrayIncludes

lodash源碼分析之arrayIncludesWith

lodash源碼分析之map的實現

lodash源碼分析之cacheHas

源碼分析

const LARGE_ARRAY_SIZE = 200
function baseDifference(array, values, iteratee, comparator) {
  let includes = arrayIncludes
  let isCommon = true
  const result = []
  const valuesLength = values.length

  if (!array.length) {
    return result
  }
  if (iteratee) {
    values = map(values, (value) => iteratee(value))
  }
  if (comparator) {
    includes = arrayIncludesWith
    isCommon = false
  }
  else if (values.length >= LARGE_ARRAY_SIZE) {
    includes = cacheHas
    isCommon = false
    values = new SetCache(values)
  }
  outer:
  for (let value of array) {
    const computed = iteratee == null ? value : iteratee(value)

    value = (comparator || value !== 0) ? value : 0
    if (isCommon && computed === computed) {
      let valuesIndex = valuesLength
      while (valuesIndex--) {
        if (values[valuesIndex] === computed) {
          continue outer
        }
      }
      result.push(value)
    }
    else if (!includes(values, computed, comparator)) {
      result.push(value)
    }
  }
  return result
}

iteratee的調用

if (iteratee) {
  values = map(values, (value) => iteratee(value))
}

如果有傳遞 iteratee ,則先調用 map ,使用 iteratee 生成要比較數組的映射數組 values

因為后面會有嵌套循環,避免重復調用 iteratee ,影響性能,所以一開始就需要生成 values 的映射數組。

性能優化

這里使用了 isCommon 來標志是否使用普通方式來處理。

if (comparator) {
  includes = arrayIncludesWith
  isCommon = false
}

如果有傳遞比較函數,則將 isCommon 標記為 false,表示不用普通的方式來處理,后面可以看到,最后會使用 includes 方法來處理,也即 arrayIncludesWith 方法。

else if (values.length >= LARGE_ARRAY_SIZE) {
  includes = cacheHas
  isCommon = false
  values = new SetCache(values)
}

如果不需要使用自定義的比較方式,並且數組較大時(這里限定了200),則使用 SetCache 類來緩存數組。

SetChche 其實使用的是 Map/Set 或者對象的方式來存儲,避免大數組嵌套循環時造成的性能損耗。

循環比較

接下來就遍歷第一個數組 array,將數組中的每一項和第二個數組的每一項比較。

if (isCommon && computed === computed) {
  let valuesIndex = valuesLength
  while (valuesIndex--) {
    if (values[valuesIndex] === computed) {
      continue outer
    }
  }
  result.push(value)
}
else if (!includes(values, computed, comparator)) {
  result.push(value)
}

可以看到,如果 isCommon 沒有標記為 false, 或者需要比較的值 computed 不為 NaN 時,都采用嵌套循環的方式來比較。循環完畢,沒有在第二個數組中發現相同的項時,將該項存入數組 result 中。

如果 isCommonfalse 或者需要比較的值為 NaN 時,則調用 includes 方法來比較。

由之前的分析得知:

  • 如果指定 comparator ,則 includesarrayIncludesWith
  • 如果被比較的數組 values 的長度超過 200 ,則 includescacheHas
  • 否則,includesarrayIncludes

+0與-0的處理

在看代碼的時候,有一段十分奇怪:

value = (comparator || value !== 0) ? value : 0

這段代碼的意思是,在沒有提供 comparator 的情況下,如果 value === 0 ,則將 value 賦值為 0

value === 0 時,可能為 +0-00 ,lodash 為什么要將它們都轉為 0 呢?

后來看到 lodash 作者在 issue 中說,因為比較會用到 Set ,而 Set 是不能區分 +0-0 的。

參考

Lodash系列——difference函數源碼解析

value = (comparator || value !== 0) ? value : 0; does it work?

License

署名-非商業性使用-禁止演繹 4.0 國際 (CC BY-NC-ND 4.0)

最后,所有文章都會同步發送到微信公眾號上,歡迎關注,歡迎提意見:

作者:對角另一面


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM