面經手冊 · 第8篇《LinkedList插入速度比ArrayList快？你確定嗎？》

本文轉載自查看原文 2020-08-31 09:08 1018 linkedlist/ java/ CodeGuide | 程序員編碼指南/ 小傅哥/ 面試題/ 數據結構

作者：小傅哥
博客：https://bugstack.cn

沉淀、分享、成長，讓自己和他人都能有所收獲！😄

一、前言

你以為考你個數據結構是要造火箭？

🚕汽車75馬力就夠奔跑了，那你怎么還想要2.0渦輪+9AT呢？大橋兩邊的護欄你每次走的時候都會去摸嗎？那怎么沒有護欄的大橋你不敢上呢？

很多時候，你額外的能力才是自身價值的體現，不要以為你的能力就只是做個業務開發每天CRUD，並不是產品讓你寫CRUD，而是因為你的能力只能產品功能設計成CRUD。

就像數據結構、算法邏輯、源碼技能，它都是可以為你的業務開發賦能的，也是寫出更好、更易擴展程序的根基，所以學好這份知識非常有必要。

本文涉及了較多的代碼和實踐驗證圖稿，歡迎關注公眾號：bugstack蟲洞棧，回復下載得到一個鏈接打開后，找到ID：19🤫獲取！

二、面試題

謝飛機，ArrayList資料看了吧？嗯，那行問問你哈🦀

問：ArrayList和LinkedList，都用在什么場景呢？

答：啊，這我知道了。ArrayList是基於數組實現、LinkedList是基於雙向鏈表實現，所以基於數據結構的不同，遍歷和查找多的情況下用ArrayList、插入和刪除頻繁的情況下用LinkedList。

問：嗯，那LinkedList的插入效率一定比ArrayList好嗎？

答：對，好！

送你個飛機✈，回去等消息吧！

其實，飛機回答的也不是不對，只是不全面。出門后不甘心買瓶肥宅水又回來，跟面試官聊了2個點，要到了兩張圖，如下；

小傅哥 bugstack.cn & ArrayList頭插、尾插、中間

小傅哥 bugstack.cn & LinkedList頭插、尾插、中間

如圖，分別是；10萬、100萬、1000萬，數據在兩種集合下不同位置的插入效果，所以：，不能說LinkedList插入就快，ArrayList插入就慢，還需要看具體的操作情況。

接下來我們帶着數據結構和源碼，具體分析下。

三、數據結構

Linked + List = 鏈表 + 列表 = LinkedList = 鏈表列表

小傅哥 bugstack.cn & LinkedList數據結構

LinkedList，是基於鏈表實現，由雙向鏈條next、prev，把數據節點穿插起來。所以，在插入數據時，是不需要像我們上一章節介紹的ArrayList那樣，擴容數組。

但，又不能說所有的插入都是高效，比如中間區域插入，他還需要遍歷元素找到插入位置。具體的細節，我們在下文的源碼分析中進行講解，也幫謝飛機掃除疑惑。

四、源碼分析

1. 初始化

與ArrayList不同，LinkedList初始化不需要創建數組，因為它是一個鏈表結構。而且也沒有傳給構造函數初始化多少個空間的入參，例如這樣是不可以的，如下；

但是，構造函數一樣提供了和ArrayList一些相同的方式，來初始化入參，如下這四種方式；

@Test
public void test_init() {
    // 初始化方式；普通方式
    LinkedList<String> list01 = new LinkedList<String>();
    list01.add("a");
    list01.add("b");
    list01.add("c");
    System.out.println(list01);
    
    // 初始化方式；Arrays.asList
    LinkedList<String> list02 = new LinkedList<String>(Arrays.asList("a", "b", "c"));
    System.out.println(list02);
    
    // 初始化方式；內部類
    LinkedList<String> list03 = new LinkedList<String>()\\{
        {add("a");add("b");add("c");}
    \\};
    System.out.println(list03);
    
    // 初始化方式；Collections.nCopies
    LinkedList<Integer> list04 = new LinkedList<Integer>(Collections.nCopies(10, 0));
    System.out.println(list04);
}

// 測試結果

[a, b, c]
[a, b, c]
[a, b, c]
[0, 0, 0, 0, 0, 0, 0, 0, 0, 0]

Process finished with exit code 0

這些方式都可以初始化操作，按需選擇即可。

2. 插入

LinkedList的插入方法比較多，List中接口中默認提供的是add，也可以指定位置插入。但在LinkedList中還提供了頭插addFirst和尾插addLast。

關於插入這部分就會講到為什么；有的時候LinkedList插入更耗時、有的時候ArrayList插入更好。

2.1 頭插

先來看一張數據結構對比圖，回顧下ArrayList的插入也和LinkedList插入做下對比，如下；

小傅哥 bugstack.cn & 插入對比

看上圖我們可以分析出幾點；

ArrayList 頭插時，需要把數組元素通過Arrays.copyOf的方式把數組元素移位，如果容量不足還需要擴容。
LinkedList 頭插時，則不需要考慮擴容以及移位問題，直接把元素定位到首位，接點鏈條鏈接上即可。

2.1.1 源碼

這里我們再對照下LinkedList頭插的源碼，如下；

private void linkFirst(E e) {
    final Node<E> f = first;
    final Node<E> newNode = new Node<>(null, e, f);
    first = newNode;
    if (f == null)
        last = newNode;
    else
        f.prev = newNode;
    size++;
    modCount++;
}

first，首節點會一直被記錄，這樣就非常方便頭插。
插入時候會創建新的節點元素，new Node<>(null, e, f)，緊接着把新的頭元素賦值給first。
之后判斷f節點是否存在，不存在則把頭插節點作為最后一個節點、存在則用f節點的上一個鏈條prev鏈接。
最后記錄size大小、和元素數量modCount。modCount用在遍歷時做校驗，modCount != expectedModCount

2.1.2 驗證

ArrayList、LinkeList，頭插源碼驗證

@Test
public void test_ArrayList_addFirst() {
    ArrayList<Integer> list = new ArrayList<Integer>();
    long startTime = System.currentTimeMillis();
    for (int i = 0; i < 10000000; i++) {
        list.add(0, i);
    }
    System.out.println("耗時：" + (System.currentTimeMillis() - startTime));
}

@Test
public void test_LinkedList_addFirst() {
    LinkedList<Integer> list = new LinkedList<Integer>();
    long startTime = System.currentTimeMillis();
    for (int i = 0; i < 10000000; i++) {
        list.addFirst(i);
    }
    System.out.println("耗時：" + (System.currentTimeMillis() - startTime));
}

比對結果：

這里我們分別驗證，10萬、100萬、1000萬的數據量，在頭插時的一個耗時情況。
如我們數據結構對比圖中一樣，ArrayList需要做大量的位移和復制操作，而LinkedList的優勢就體現出來了，耗時只是實例化一個對象。

2.2 尾插

先來看一張數據結構對比圖，回顧下ArrayList的插入也和LinkedList插入做下對比，如下；

小傅哥 bugstack.cn & 插入對比

看上圖我們可以分析出幾點；

ArrayList 尾插時，是不需要數據位移的，比較耗時的是數據的擴容時，需要拷貝遷移。
LinkedList 尾插時，與頭插相比耗時點會在對象的實例化上。

2.2.1 源碼

這里我們再對照下LinkedList尾插的源碼，如下；

void linkLast(E e) {
    final Node<E> l = last;
    final Node<E> newNode = new Node<>(l, e, null);
    last = newNode;
    if (l == null)
        first = newNode;
    else
        l.next = newNode;
    size++;
    modCount++;
}

與頭插代碼相比幾乎沒有什么區別，只是first換成last
耗時點只是在創建節點上，Node<E>

2.2.2 驗證

ArrayList、LinkeList，尾插源碼驗證

@Test
public void test_ArrayList_addLast() {
    ArrayList<Integer> list = new ArrayList<Integer>();
    long startTime = System.currentTimeMillis();
    for (int i = 0; i < 10000000; i++) {
        list.add(i);
    }
    System.out.println("耗時：" + (System.currentTimeMillis() - startTime));
}

@Test
public void test_LinkedList_addLast() {
    LinkedList<Integer> list = new LinkedList<Integer>();
    long startTime = System.currentTimeMillis();
    for (int i = 0; i < 1000000; i++) {
        list.addLast(i);
    }
    System.out.println("耗時：" + (System.currentTimeMillis() - startTime));
}

比對結果：

這里我們分別驗證，10萬、100萬、1000萬的數據量，在尾插時的一個耗時情況。
如我們數據結構對比圖中一樣，ArrayList 不需要做位移拷貝也就不那么耗時了，而LinkedList則需要創建大量的對象。所以這里ArrayList尾插的效果更好一些。

2.3 中間插

先來看一張數據結構對比圖，回顧下ArrayList的插入也和LinkedList插入做下對比，如下；

看上圖我們可以分析出幾點；

ArrayList 中間插入，首先我們知道他的定位時間復雜度是O(1)，比較耗時的點在於數據遷移和容量不足的時候擴容。
LinkedList 中間插入，鏈表的數據實際插入時候並不會怎么耗時，但是它定位的元素的時間復雜度是O(n)，所以這部分以及元素的實例化比較耗時。

2.3.1 源碼

這里看下LinkedList指定位置插入的源碼；

使用add(位置、元素)方法插入：

public void add(int index, E element) {
    checkPositionIndex(index);
    if (index == size)
        linkLast(element);
    else
        linkBefore(element, node(index));
}

位置定位node(index)：

Node<E> node(int index) {
    // assert isElementIndex(index);
    if (index < (size >> 1)) {
        Node<E> x = first;
        for (int i = 0; i < index; i++)
            x = x.next;
        return x;
    } else {
        Node<E> x = last;
        for (int i = size - 1; i > index; i--)
            x = x.prev;
        return x;
    }
}

size >> 1，這部分的代碼判斷元素位置在左半區間，還是右半區間，在進行循環查找。

執行插入：

void linkBefore(E e, Node<E> succ) {
    // assert succ != null;
    final Node<E> pred = succ.prev;
    final Node<E> newNode = new Node<>(pred, e, succ);
    succ.prev = newNode;
    if (pred == null)
        first = newNode;
    else
        pred.next = newNode;
    size++;
    modCount++;
}

找到指定位置插入的過程就比較簡單了，與頭插、尾插，相差不大。
整個過程可以看到，插入中比較耗時的點會在遍歷尋找插入位置上。

2.3.2 驗證

ArrayList、LinkeList，中間插入源碼驗證

@Test
public void test_ArrayList_addCenter() {
    ArrayList<Integer> list = new ArrayList<Integer>();
    long startTime = System.currentTimeMillis();
    for (int i = 0; i < 10000000; i++) {
        list.add(list.size() >> 1, i);
    }
    System.out.println("耗時：" + (System.currentTimeMillis() - startTime));
}

@Test
public void test_LinkedList_addCenter() {
    LinkedList<Integer> list = new LinkedList<Integer>();
    long startTime = System.currentTimeMillis();
    for (int i = 0; i < 1000000; i++) {
        list.add(list.size() >> 1, i);
    }
    System.out.println("耗時：" + (System.currentTimeMillis() - startTime));
}

比對結果：

這里我們分別驗證，10萬、100萬、1000萬的數據量，在中間插時的一個耗時情況。
可以看到Linkedlist在中間插入時，遍歷尋找位置還是非常耗時了。所以不同的情況下，需要選擇不同的List集合做業務。

3. 刪除

講了這么多插入的操作后，刪除的知識點就很好理解了。與ArrayList不同，刪除不需要拷貝元素，LinkedList是找到元素位置，把元素前后鏈連接上。基本如下圖；

確定出要刪除的元素x，把前后的鏈接進行替換。
如果是刪除首尾元素，操作起來會更加容易，這也就是為什么說插入和刪除快。但中間位置刪除，需要遍歷找到對應位置。

3.1 刪除操作方法

序號	方法	描述
1	list.remove();	與removeFirst()一致
2	list.remove(1);	刪除Idx=1的位置元素節點，需要遍歷定位
3	list.remove("a");	刪除元素="a"的節點，需要遍歷定位
4	list.removeFirst();	刪除首位節點
5	list.removeLast();	刪除結尾節點
6	list.removeAll(Arrays.asList("a", "b"));	按照集合批量刪除，底層是Iterator刪除

源碼：

@Test
public void test_remove() {
    LinkedList<String> list = new LinkedList<String>();
    list.add("a");
    list.add("b");
    list.add("c");
    
    list.remove();
    list.remove(1);
    list.remove("a");
    list.removeFirst();
    list.removeLast();
    list.removeAll(Arrays.asList("a", "b"));
}

3.2 源碼

刪除操作的源碼都差不多，分為刪除首尾節點與其他節點時候，對節點的解鏈操作。這里我們舉例一個刪除其他位置的源碼進行學習，如下；

list.remove("a");

public boolean remove(Object o) {
    if (o == null) {
        for (Node<E> x = first; x != null; x = x.next) {
            if (x.item == null) {
                unlink(x);
                return true;
            }
        }
    } else {
        for (Node<E> x = first; x != null; x = x.next) {
            if (o.equals(x.item)) {
                unlink(x);
                return true;
            }
        }
    }
    return false;
}

這一部分是元素定位，和 unlink(x)解鏈。循環查找對應的元素，這部分沒有什么難點。

unlink(x)解鏈

E unlink(Node<E> x) {
    // assert x != null;
    final E element = x.item;
    final Node<E> next = x.next;
    final Node<E> prev = x.prev;
    
    if (prev == null) {
        first = next;
    } else {
        prev.next = next;
        x.prev = null;
    }
    
    if (next == null) {
        last = prev;
    } else {
        next.prev = prev;
        x.next = null;
    }
    
    x.item = null;
    size--;
    modCount++;
    return element;
}

這部分源碼主要有以下幾個知識點；

獲取待刪除節點的信息；元素item、元素下一個節點next、元素上一個節點prev。
如果上個節點為空則把待刪除元素的下一個節點賦值給首節點，否則把待刪除節點的下一個節點，賦值給待刪除節點的上一個節點的子節點。
同樣待刪除節點的下一個節點next，也執行2步驟同樣操作。
最后是把刪除節點設置為null，並扣減size和modeCount數量。

4. 遍歷

接下來說下遍歷，ArrayList與LinkedList的遍歷都是通用的，基本包括5種方式。

這里我們先初始化出待遍歷的集合1千萬數據；

int xx = 0;
@Before
public void init() {
    for (int i = 0; i < 10000000; i++) {
        list.add(i);
    }
}

4.1 普通for循環

@Test
public void test_LinkedList_for0() {
    long startTime = System.currentTimeMillis();
    for (int i = 0; i < list.size(); i++) {
        xx += list.get(i);
    }
    System.out.println("耗時：" + (System.currentTimeMillis() - startTime));
}

4.2 增強for循環

@Test
public void test_LinkedList_for1() {
    long startTime = System.currentTimeMillis();
    for (Integer itr : list) {
        xx += itr;
    }
    System.out.println("耗時：" + (System.currentTimeMillis() - startTime));
}

4.3 Iterator遍歷

@Test
public void test_LinkedList_Iterator() {
    long startTime = System.currentTimeMillis();
    Iterator<Integer> iterator = list.iterator();
    while (iterator.hasNext()) {
        Integer next = iterator.next();
        xx += next;
    }
    System.out.println("耗時：" + (System.currentTimeMillis() - startTime))
}

4.4 forEach循環

@Test
public void test_LinkedList_forEach() {
    long startTime = System.currentTimeMillis();
    list.forEach(integer -> {
        xx += integer;
    });
    System.out.println("耗時：" + (System.currentTimeMillis() - startTime));
}

4.5 stream(流)

@Test
public void test_LinkedList_stream() {
    long startTime = System.currentTimeMillis();
    list.stream().forEach(integer -> {
        xx += integer;
    });
    System.out.println("耗時：" + (System.currentTimeMillis() - startTime));
}

那么，以上這5種遍歷方式誰最慢呢？按照我們的源碼學習分析下吧，歡迎留下你的答案在評論區！

五、總結

ArrayList與LinkedList都有自己的使用場景，如果你不能很好的確定，那么就使用ArrayList。但如果你能確定你會在集合的首位有大量的插入、刪除以及獲取操作，那么可以使用LinkedList，因為它都有相應的方法；addFirst、addLast、removeFirst、removeLast、getFirst、getLast，這些操作的時間復雜度都是O(1)，非常高效。
LinkedList的鏈表結構不一定會比ArrayList節省空間，首先它所占用的內存不是連續的，其次他還需要大量的實例化對象創造節點。雖然不一定節省空間，但鏈表結構也是非常優秀的數據結構，它能在你的程序設計中起着非常優秀的作用，例如可視化的鏈路追蹤圖，就是需要鏈表結構，並需要每個節點自旋一次，用於串聯業務。
程序的精髓往往就是數據結構的設計，這能為你的程序開發提供出非常高的效率改變。可能目前你還不能用到，但萬一有一天你需要去造🚀火箭了呢？

六、系列文章

免責聲明！

本站轉載的文章為個人學習借鑒使用，本站對版權不負任何法律責任。如果侵犯了您的隱私權益，請聯系本站郵箱yoyou2525@163.com刪除。

猜您在找 面經手冊 · 第20篇《Thread 線程，狀態轉換、方法使用、原理分析》面經手冊 · 第14篇《volatile 怎么實現的內存可見？沒有 volatile 一定不可見嗎？》 ArrayList與LinkedList哪個插入性能高？不斷的向數組的中間插入數據，ArrayList和LinkedList哪個快一篇入門 — Gatling 性能測試手冊第三篇：JMeter 組件手冊小白的 Python 修煉手冊：入門篇手冊 awk 手冊 BOSCH汽車工程手冊————自適應巡航速度控制ACC