Java> ArrayList的擴容因子為什么是1.5？

本文轉載自查看原文 2021-01-14 20:38 4743 Java

ArrayList底層是數組elementData，用於存放插入的數據。初始大小是0，當有數據插入時，默認大小DEFAULT_CAPACITY = 10。

/**
     * The array buffer into which the elements of the ArrayList are stored.
     * The capacity of the ArrayList is the length of this array buffer. Any
     * empty ArrayList with elementData == DEFAULTCAPACITY_EMPTY_ELEMENTDATA
     * will be expanded to DEFAULT_CAPACITY when the first element is added.
     */
    transient Object[] elementData; // non-private to simplify nested class access

什么時候進行擴容？

當插入數據，導致size + 1 > elementData.length，也就是需要從容量超過目前數組長度時，需要進行擴容。

    public boolean add(E e) {
        ensureCapacityInternal(size + 1);  // Increments modCount!! // add一個元素時，size + 1
        elementData[size++] = e;
        return true;
    }

    private void ensureCapacityInternal(int minCapacity) {
        ensureExplicitCapacity(calculateCapacity(elementData, minCapacity)); 
    }

    private void ensureExplicitCapacity(int minCapacity) {
        modCount++;

        // overflow-conscious code
        if (minCapacity - elementData.length > 0)
            grow(minCapacity);
    }

    private static int calculateCapacity(Object[] elementData, int minCapacity) { // 計算新容量
        if (elementData == DEFAULTCAPACITY_EMPTY_ELEMENTDATA) { // 代表elementData數組還是一個空數組，沒有任何數據
            return Math.max(DEFAULT_CAPACITY, minCapacity); // elementData為空時，會擴容到DEFAULT_CAPACITY = 10和minCapacity的最大值，而minCapacity在插入數據時第一次值為1（size + 1 = 1），會擴容為10
        }
        return minCapacity;
    }

如何擴容？

新數組容量為舊數組的1.5倍：newCapacity = 1.5 * oldCapacity ，並且將舊數組內容通過Array.copyOf全部復制到新數組。此時，size還未真正+1，新舊數組長度（size一致），不過容量不同。
把這里的系數1.5，稱作擴容因子k = newCapacity / oldCapacity

    /**
     * Increases the capacity to ensure that it can hold at least the
     * number of elements specified by the minimum capacity argument.
     *
     * @param minCapacity the desired minimum capacity
     */
    private void grow(int minCapacity) {
        // overflow-conscious code
        int oldCapacity = elementData.length;
        int newCapacity = oldCapacity + (oldCapacity >> 1);
        if (newCapacity - minCapacity < 0)
            newCapacity = minCapacity;
        if (newCapacity - MAX_ARRAY_SIZE > 0)
            newCapacity = hugeCapacity(minCapacity);
        // minCapacity is usually close to size, so this is a win:
        elementData = Arrays.copyOf(elementData, newCapacity);
    }

    private static int hugeCapacity(int minCapacity) {
        if (minCapacity < 0) // overflow
            throw new OutOfMemoryError();
        return (minCapacity > MAX_ARRAY_SIZE) ?
            Integer.MAX_VALUE :
            MAX_ARRAY_SIZE;
    }

擴容因子k為何是1.5？

參考C++ STL 中 vector 內存用盡后, 為什么每次是 2 倍的增長, 而不是 3 倍或其他值? - Milo Yip的回答 - 知乎，有一個很通俗的解釋，擴容因子最適合范圍為(1, 2)。

下面舉一組對比的例子，取不同擴容因子和初始容量的內存分配情況，當然容量不可能是4，只是方便說明：

k = 2, capacity = 4
0123
    01234567
            0123456789101112131415
                                  012345678910111213141516171819202122232425262728293031
                                                                                        0123...

k = 1.5, capacity = 4
0123
    012345
          012345678
                <--(0123456789101112)
0123456789101112
                ...

k=1.5時，就能充分利用前面已經釋放的空間。如果k >= 2，新容量剛剛好永遠大於過去所有廢棄的數組容量。

為什么不取擴容固定容量呢？
擴容的目的需要綜合考慮這兩種情況：

擴容容量不能太小，防止頻繁擴容，頻繁申請內存空間 + 數組頻繁復制
擴容容量不能太大，需要充分利用空間，避免浪費過多空間；

而擴容固定容量，很難決定到底取多少值合適，取任何具體值都不太合適，因為所需數據量往往由數組的客戶端在具體應用場景決定。依賴於當前已經使用的量 * 系數，比較符合實際應用場景。
比如，我現在已經用到一個數組100的容量，接下來很可能會有這個數量級的數據需要插入。

為什么是1.5，而不是1.2，1.25，1.8或者1.75？
因為1.5 可以充分利用移位操作，減少浮點數或者運算時間和運算次數。

// 新容量計算
int newCapacity = oldCapacity + (oldCapacity >> 1);

免責聲明！

本站轉載的文章為個人學習借鑒使用，本站對版權不負任何法律責任。如果侵犯了您的隱私權益，請聯系本站郵箱yoyou2525@163.com刪除。

猜您在找 Java ArrayList自動擴容機制 ArrayList是如何擴容的？ ArrayList、Vector、HashMap、HashTable、HashSet的默認初始容量、加載因子、擴容增量、具體區別 ArrayList、Vector、HashMap、HashTable、HashSet的默認初始容量、加載因子、擴容增量 Java集合類初始容量、加載因子、擴容增量 ArrayList的擴容機制 ArrayList擴容機制關於ArrayList的擴容機制 ArrayList 擴容原理 ArrayList擴容機制