ArrayList源碼學習

本文基於JDK1.8版本，對集合中的巨頭ArrayList做一定的源碼學習，將會參考大量資料，在文章后面都會給出參考文章鏈接，本文用以鞏固學習知識。

ArrayList的繼承體系

ArrayList繼承了AbstracList這個抽象類，還實現了List接口，提供了添加、刪除、修改、遍歷等功能。至於其他接口，以后再做總結。

ArrayList核心源碼

底層基於數組實現，我們可以查看源碼，了解其擁有的一些屬性：

private static final long serialVersionUID = 8683452581122892189L;

//默認的初始容量為10
private static final int DEFAULT_CAPACITY = 10;

//如果指定數組容量為0，返回該數組，相當於new ArrayList<>(0);
private static final Object[] EMPTY_ELEMENTDATA = {};

//沒有指定容量時，返回該數組，與上面不同的是：new ArrayList<>();
private static final Object[] DEFAULTCAPACITY_EMPTY_ELEMENTDATA = {};

//該數組保存着ArrayList存儲的元素，任何沒有指定容量的ArrayList在添加第一個元素后，將會擴容至初始容量10
transient Object[] elementData; // non-private to simplify nested class access

//代表了當前存儲元素的數量
private int size;

再次強調將EMPTY_ELEMENTDATA和DEFAULTCAPACITY_EMPTY_ELEMENTDATA區分開來是為了明確添加第一個元素時，應該擴容的大小，具體擴容的機制，后面會分析。

我們再來瞧瞧它的構造器：

    
    //該構造器用以創建一個可以指定容量的列表
    public ArrayList(int initialCapacity) {
        if (initialCapacity > 0) {
            //創建一個指定容量大小的數組
            this.elementData = new Object[initialCapacity];
        } else if (initialCapacity == 0) {
            //指定容量為0，對應EMPTY_ELEMENTDATA數組
            this.elementData = EMPTY_ELEMENTDATA;
        } else {
            throw new IllegalArgumentException("Illegal Capacity: "+
                                               initialCapacity);
        }
    }

    //默認無參構造器，賦值空數組，但是在第一次添加之后，容量變為默認容量10
    public ArrayList() {
        this.elementData = DEFAULTCAPACITY_EMPTY_ELEMENTDATA;
    }

    //傳入一個集合，根據該集合迭代器返回順序，構造一個指定集合里元素的列表
    public ArrayList(Collection<? extends E> c) {
        elementData = c.toArray();
        //傳入集合不為空長
        if ((size = elementData.length) != 0) {
            //傳入集合轉化為的數組可能不是Object[]需要判斷
            if (elementData.getClass() != Object[].class)
                elementData = Arrays.copyOf(elementData, size, Object[].class);
        } else {
            //傳入集合為元素數量為0，用空數組代替即可
            this.elementData = EMPTY_ELEMENTDATA;
        }
    }
    //指定集合為null的話（並不是說集合為空長），調用ArrayList的toArray方法，可能會拋出空指針異常

ArrayList擴容機制

了解完ArrayList基本的屬性和構造器之后，我們將對里面包含的方法進行學習：

上面說到，使用默認構造器時，初始化賦值其實是個空數組，在添加了一個元素之后，容量才會變成10，是不是會覺得有點好奇呢，我們先來瞧一瞧它的add系列方法：

    //沒有指定索引，默認在尾部添加元素
    public boolean add(E e) {
 
        ensureCapacityInternal(size + 1);  // Increments modCount!!
        //擴容之后，下一位賦值為e，size加1
        elementData[size++] = e;
        return true;
    }

    private void ensureCapacityInternal(int minCapacity) {
        ensureExplicitCapacity(calculateCapacity(elementData, minCapacity));
    }

    //判斷是否為默認構造器生成的數組，並將minCapacity置為0；如果不是，minCapacity還是傳入的size+1
    private static int calculateCapacity(Object[] elementData, int minCapacity) {
        if (elementData == DEFAULTCAPACITY_EMPTY_ELEMENTDATA) {
            //使用默認構造器，那么才會返回所需要的最小容量為默認容量10
            return Math.max(DEFAULT_CAPACITY, minCapacity);
        }
        //minCapacity = size+1 
        return minCapacity;
    }

    private void ensureExplicitCapacity(int minCapacity) {
        //定義在AbstractList中，用於存儲結構修改次數
        modCount++;

        //如果最小容量比數組總長度還大，就擴容
        if (minCapacity - elementData.length > 0)
            grow(minCapacity);
    }

    //擴容操作
    private void grow(int minCapacity) {
        int oldCapacity = elementData.length;
        //將舊容量右移一位在加上本身，像當於新容量為就容量的1.5倍
        int newCapacity = oldCapacity + (oldCapacity >> 1);
        //1.新數組的容量還是不能滿足需要的最小容量，如初始指定容量為0時的情況
        //2.新數組越過了整數邊界，newCapacity將會小於0
        if (newCapacity - minCapacity < 0)
            newCapacity = minCapacity;
        //如果新數組的容量比數組最大的容量Integer.MAX_VALUE - 8還大，
        //調用hugeCapacity方法
        if (newCapacity - MAX_ARRAY_SIZE > 0)

            newCapacity = hugeCapacity(minCapacity);
        elementData = Arrays.copyOf(elementData, newCapacity);
    }

    //比較最小容量和MAX_ARRAY_SIZE
    private static int hugeCapacity(int minCapacity) {
        if (minCapacity < 0) // overflow
            throw new OutOfMemoryError();
        //三目表達式：如果真的需要擴這么大容量的情況下：
        //1.最小容量大於MAX_ARRAY_SIZE，新容量等於Integer.MAX_VALUE，否則新容量為Integer.MAX_VALUE-8
        return (minCapacity > MAX_ARRAY_SIZE) ?
            Integer.MAX_VALUE :
            MAX_ARRAY_SIZE;
    }

根據擴容操作，如果我們一開始使用的是默認構造器生成的數組，在第一次增加之后容量就會變成默認容量10，之后才會以1.5倍進行擴容。
但是如果我們指定的是以0為容量的話，會通過grow方法，前四次擴容每次都只是增加1，頻繁地調用copyOf就非常難受了，所以在知道目標大概多大時，可以通過public void ensureCapacity(int minCapacity)方法預先設置容量。參考:https://www.iteye.com/topic/577602。（但是經過我的個人測試：在1億級或以上地數量上，沒有調用該方法要快一些，但是真實場景應該不會把這么多的數據存放在里面吧，所以可以的話，用上這個方法，提升性能呀。）
關於newCapacity - minCapacity < 0的思考，很容易能看出判定條件是新容量<需要的最小容量。但是這個條件怎樣才能達到呢
- 當原容量為0或1時，擴容就會滿足該條件。
- 當原容量足夠大時，它的1.5倍會越過整數邊界，變為負值，同樣滿足。
注意：移位運算效率會比整除運算更高一些。
modCount代表的是已對列表進行結構更改的次數，可以看到，每次執行添加操作時，一定都會讓該次數加1。設計到的fail-fast機制，我們之后將會繼續學習，暫不贅述。
其實擴容的方式就是我們看到的，創建一個以新容量為長度的新數組，並將原來數組的值全部拷貝到新數組上，最后讓elementData指向這個新數組。

文章寫到這里，我大舒一口長氣，層層嵌套的調用終於結束了，不知道你們的內心是否也和我一樣哈。我們趁熱打鐵，趕緊看看另一個重載的add方法。

    //在索引為index處插入E
    public void add(int index, E element) {
        //索引越界判斷
        rangeCheckForAdd(index);

        //同上，確保有足夠容量添加元素
        ensureCapacityInternal(size + 1);  // Increments modCount!!
        //實際上Arrays.copyOf的底層調用的就是這個方法，意思是在原數組上從索引的位置到最后整體向后復制一位，相當於移動的長度為 (size-1) - index +1 = size -index
        System.arraycopy(elementData, index, elementData, index + 1,
                         size - index);
        //在將index處填上元素E
        elementData[index] = element;
        //元素數量+1
        size++;
    }

有了前面的鋪墊，相對來說就比較輕松了。我們不妨看看判斷數組越界的方法，媽呀，這就更加清晰了，但是需要注意的是index==size在添加操作里，相當於從尾部插入，並不會構成越界：

    private void rangeCheckForAdd(int index) {
        if (index > size || index < 0)
            throw new IndexOutOfBoundsException(outOfBoundsMsg(index));
    }

看完了“增”的兩個方法，該輪到同是四胞胎兄弟的“刪”了。再談“刪”之前，我們要明確，ArrayList底層基於數組實現，可依靠連續索引值存取獲取數據就變得理所當然了：

E elementData(int index) {
    return (E) elementData[index];
}

下面是“刪”操作，需要注意的是，remove操作並不能夠將容量減少，只是將其中的元素數量變少，自始至終只是size在變化，不信你看：

    //移除指定位置的元素，並將其返回 
    public E remove(int index) {
        //范圍判斷
        rangeCheck(index);
        //操作列表，計數加1
        modCount++;
        //取出舊值
        E oldValue = elementData(index);

        //相當於把index+1位置向后的所有元素集體向前復制一位，復制的長度就是
        //(size-1)-(index+1)+1 = numMoved
        int numMoved = size - index - 1;
        if (numMoved > 0)
            //執行集體拷貝動作
            System.arraycopy(elementData, index+1, elementData, index,
                             numMoved);
        //並讓最后一個空出來的位置指向null，點名讓GC清理
        elementData[--size] = null; 
        //返回舊值
        return oldValue;
    }

可以稍微看一下rangeCheck的代碼，與add操作里判定略有不同，省去了index<0的判斷，我一開始很疑惑，后來發現后面有對數組的索引值取值，還是會發生異常：

    private void rangeCheck(int index) {
        if (index >= size)
            throw new IndexOutOfBoundsException(outOfBoundsMsg(index));
    }

我覺得有必要總結一下System.arraycopy這個方法，public static native void arraycopy(Object src, int srcPos,Object dest, int destPos,int length);native修飾符，底層並不是Java實現，而是c和c++。
這個方法的作用呢：就是從指定的源數組（src）從指定位置（srcPos）開始復制數組到目標數組（dest）的指定位置（destPos），復制的個數正好是length。
而Arrays.copyOf這個方法雖然底層調用了System.arraycopy，但是使用上是不太一樣的，它不需要目標數組，系統會自動在內部新建一個數組，並返回。
哇，感覺add部分講完，真的思路及其清晰，簡直豁然開朗呢。咱們繼續來remove！

    //移除指定元素，找到並刪除返回true，沒找到返回false
    public boolean remove(Object o) {
        //判斷指定的元素是否本身就是null值
        if (o == null) {
            for (int index = 0; index < size; index++)
                //找到同為null值的那個“它”
                if (elementData[index] == null) {
                    //快速刪除，刪除操作和之前類似，只是省略了范圍判斷，就不贅述了
                    fastRemove(index);
                    return true;
                }
        } else {
            for (int index = 0; index < size; index++)
                //不是空值的話，就找值相等的，注意不要elementData[index].equals(o),時刻避免空指針
                if (o.equals(elementData[index])) {
                    fastRemove(index);
                    return true;
                }
        }
        return false;
    }

還有一個范圍性的removeRange就不贅述了，總結一下：ArrayList中的remove操作基於數組的拷貝，並將remove的長度置空，元素數量相應減少（只是元素數量減少，數組容量並不會改變）。
對了，清理的話，clear方法會清理的相對干凈一些，但是依舊只是size變化：

    public void clear() {
        modCount++;

        //將所有元素置空，等待GC寵幸
        for (int i = 0; i < size; i++)
            elementData[i] = null;

        size = 0;
    }

當然，如果你希望數組容量也發生變化的話。你可以試試下面的這個方法：

    //將ArrayList容量調整為當前size的大小
    public void trimToSize() {
        modCount++;
        //基於三目運算
        if (size < elementData.length) {
            elementData = (size == 0)
              ? EMPTY_ELEMENTDATA
              : Arrays.copyOf(elementData, size);
        }
    }

接下來，講一講相當簡單的set與get這對基佬操作：

    //用指定值替換只當索引位置上的值
    public E set(int index, E element) {
        rangeCheck(index);

        E oldValue = elementData(index);
        elementData[index] = element;
        return oldValue;
    }
    //獲取指定索引位置上的值
    public E get(int index) {
        rangeCheck(index);

        return elementData(index);
    }

然后是姐妹花操作：indexOf和lastIndexOf。(ps:尋找元素的過程可以參考remove指定元素的過程），以indexOf為例，lastIndexOf從尾部向前遍歷即可。

    //判斷o在ArrayList中第一次出現的位置
    public int indexOf(Object o) {
        if (o == null) {
            for (int i = 0; i < size; i++)
                if (elementData[i]==null)
                    return i;
        } else {
            for (int i = 0; i < size; i++)
                if (o.equals(elementData[i]))
                    return i;
        }
        return -1;
    }

通過indexOf方法的返回值，我們還可以判斷某個元素是否存在：

    public boolean contains(Object o) {
        return indexOf(o) >= 0;
    }

除了單個元素增之外，ArrayList中還提供了可以將整個集合增加到本身尾部的方法：

    //把傳入集合中的所有元素全部加到本身集合的后面，如果發生改變就返回true
    public boolean addAll(Collection<? extends E> c) {
        //將傳入集合轉化為列表，如果傳入集合為null，會發生空指針異常
        Object[] a = c.toArray();
        int numNew = a.length;
        //確定新長度是否需要擴容
        ensureCapacityInternal(size + numNew);  // Increments modCount
        System.arraycopy(a, 0, elementData, size, numNew);
        size += numNew;
        //傳入為空集合就為false，因為不會發生改變
        return numNew != 0;
    }

它的重載方法是在指定位置插入另一個集合中地所有元素，並且以迭代的順序排列：

    //在指定位置插入另一集合中的所有元素
    public boolean addAll(int index, Collection<? extends E> c) {
        rangeCheckForAdd(index);
        //還是會引發空指針
        Object[] a = c.toArray();
        //傳入新集合c的元素個數
        int numNew = a.length;
        ensureCapacityInternal(size + numNew);  // Increments modCount
        //要移動的個數：(size-1)-index+1 = numMoved
        int numMoved = size - index;
        if (numMoved > 0)
            System.arraycopy(elementData, index, elementData, index + numNew,
                             numMoved);
        //size<index的情況，前面就會拋異常，所以這里只能index==size，相當於從尾部添加
        System.arraycopy(a, 0, elementData, index, numNew);
        size += numNew;
        return numNew != 0;
    }

最后的總結

ArrayList基於數組實現，查詢便利，通過擴容機制實現動態增長。
默認構造器生成的ArrayList初始化賦值其實是空數組，增加第一個元素之后變為10.
擴容機制讓每次的新容量都是原容量的1.5倍，且基於右移運算。
增加和刪除的操作底層基於數組拷貝，底層都調用了arraycopy的方法。
由於復制拷貝，導致增刪的操作大多數情況下的效率會降低，但是並不是絕對的，如果一直在尾部插，尾部刪的話，還是挺快的。
對了，它是線程不安全的，這個以后學習的時候在做總結吧。

對了如果不出意外的話，之后會帶來LinkedList的源碼學習，如果覺得我有敘述錯誤的地方，或者我沒有說明白點地方，還望評論區批評指正，一起學習交流，加油加油！
參考鏈接：
淺談ArrayList動態擴容
 List集合就這么簡單【源碼剖析】
https://github.com/Snailclimb/JavaGuide/blob/master/docs/java/collection/ArrayList.md

免責聲明！

本站轉載的文章為個人學習借鑒使用，本站對版權不負任何法律責任。如果侵犯了您的隱私權益，請聯系本站郵箱yoyou2525@163.com刪除。

猜您在找 Java小白集合源碼的學習系列：Vector 【Java集合】ArrayList源碼分析死磕 java集合之ArrayList源碼分析 Java 集合系列03之 ArrayList詳細介紹(源碼解析)和使用示例 (一)ArrayList集合源碼解析集合系列 List（二）：ArrayList Java集合系列(二)：ArrayList、LinkedList、Vector的使用方法及區別 Java集合之ArrayList Java集合 -- ArrayList集合及應用 Java——ArrayList源碼解析