ArrayList底層是數組elementData,用於存放插入的數據。初始大小是0,當有數據插入時,默認大小DEFAULT_CAPACITY = 10。
/**
* The array buffer into which the elements of the ArrayList are stored.
* The capacity of the ArrayList is the length of this array buffer. Any
* empty ArrayList with elementData == DEFAULTCAPACITY_EMPTY_ELEMENTDATA
* will be expanded to DEFAULT_CAPACITY when the first element is added.
*/
transient Object[] elementData; // non-private to simplify nested class access
什么時候進行擴容?
當插入數據,導致size + 1 > elementData.length,也就是需要從容量超過目前數組長度時,需要進行擴容。
public boolean add(E e) {
ensureCapacityInternal(size + 1); // Increments modCount!! // add一個元素時,size + 1
elementData[size++] = e;
return true;
}
private void ensureCapacityInternal(int minCapacity) {
ensureExplicitCapacity(calculateCapacity(elementData, minCapacity));
}
private void ensureExplicitCapacity(int minCapacity) {
modCount++;
// overflow-conscious code
if (minCapacity - elementData.length > 0)
grow(minCapacity);
}
private static int calculateCapacity(Object[] elementData, int minCapacity) { // 計算新容量
if (elementData == DEFAULTCAPACITY_EMPTY_ELEMENTDATA) { // 代表elementData數組還是一個空數組,沒有任何數據
return Math.max(DEFAULT_CAPACITY, minCapacity); // elementData為空時,會擴容到DEFAULT_CAPACITY = 10和minCapacity的最大值,而minCapacity在插入數據時第一次值為1(size + 1 = 1),會擴容為10
}
return minCapacity;
}
如何擴容?
新數組容量為舊數組的1.5倍:newCapacity = 1.5 * oldCapacity ,並且將舊數組內容通過Array.copyOf全部復制到新數組。此時,size還未真正+1,新舊數組長度(size一致),不過容量不同。
把這里的系數1.5,稱作擴容因子k = newCapacity / oldCapacity
/**
* Increases the capacity to ensure that it can hold at least the
* number of elements specified by the minimum capacity argument.
*
* @param minCapacity the desired minimum capacity
*/
private void grow(int minCapacity) {
// overflow-conscious code
int oldCapacity = elementData.length;
int newCapacity = oldCapacity + (oldCapacity >> 1);
if (newCapacity - minCapacity < 0)
newCapacity = minCapacity;
if (newCapacity - MAX_ARRAY_SIZE > 0)
newCapacity = hugeCapacity(minCapacity);
// minCapacity is usually close to size, so this is a win:
elementData = Arrays.copyOf(elementData, newCapacity);
}
private static int hugeCapacity(int minCapacity) {
if (minCapacity < 0) // overflow
throw new OutOfMemoryError();
return (minCapacity > MAX_ARRAY_SIZE) ?
Integer.MAX_VALUE :
MAX_ARRAY_SIZE;
}
擴容因子k為何是1.5?
參考C++ STL 中 vector 內存用盡后, 為什么每次是 2 倍的增長, 而不是 3 倍或其他值? - Milo Yip的回答 - 知乎 ,有一個很通俗的解釋,擴容因子最適合范圍為(1, 2)。
下面舉一組對比的例子,取不同擴容因子和初始容量的內存分配情況,當然容量不可能是4,只是方便說明:
k = 2, capacity = 4
0123
01234567
0123456789101112131415
012345678910111213141516171819202122232425262728293031
0123...
k = 1.5, capacity = 4
0123
012345
012345678
<--(0123456789101112)
0123456789101112
...
k=1.5時,就能充分利用前面已經釋放的空間。如果k >= 2,新容量剛剛好永遠大於過去所有廢棄的數組容量。
- 為什么不取擴容固定容量呢?
擴容的目的需要綜合考慮這兩種情況:
- 擴容容量不能太小,防止頻繁擴容,頻繁申請內存空間 + 數組頻繁復制
- 擴容容量不能太大,需要充分利用空間,避免浪費過多空間;
而擴容固定容量,很難決定到底取多少值合適,取任何具體值都不太合適,因為所需數據量往往由數組的客戶端在具體應用場景決定。依賴於當前已經使用的量 * 系數, 比較符合實際應用場景。
比如,我現在已經用到一個數組100的容量,接下來很可能會有這個數量級的數據需要插入。
- 為什么是1.5,而不是1.2,1.25,1.8或者1.75?
因為1.5 可以充分利用移位操作,減少浮點數或者運算時間和運算次數。
// 新容量計算
int newCapacity = oldCapacity + (oldCapacity >> 1);