圖解 | 原來這就是線程池


小宇:閃客,我最近看到線程池,被里邊亂七八槽的參數給搞暈了,你能不能給我講講呀?

閃客:沒問題,這個我擅長,咱們從一個最簡單的情況開始,假設有一段代碼,你希望異步執行它,是不是要寫出這樣的代碼?

new Thread(r).start();

  小宇:嗯嗯,最簡單的寫法似乎就是這樣呢。

閃客:這種寫法當然可以完成功能,可是你這樣寫,老王這樣寫,老張也這樣寫,程序中到處都是這樣創建線程的方法,能不能寫一個統一的工具類讓大家調用呢?

小宇:可以的,感覺有一個統一的工具類,更優雅一些。

閃客:那如果讓你來設計這個工具類,你會怎么寫呢?我先給你定一個接口,你來實現。

public interface Executor {
    public void execute(Runnable r);
}

小宇:emmm,我可能先定義幾個成員變量,比如核心線程數、最大線程數 ...反正就是那些亂七八糟的參數。

閃客:STOP!小宇呀,你現在深受面試手冊的毒害,你先把這些全部的概念忘掉,就說讓你寫一個最簡單的工具類,第一反應,你會怎么寫?

 

第一版

小宇:那我可能會這樣

// 新線程:直接創建一個新線程運行
class FlashExecutor implements Executor {
    public void execute(Runnable r) {
        new Thread(r).start();
    }
}

  閃客:嗯嗯很好,你的思路非常棒。

小宇:啊,我這個會不會太 low 了呀,我還以為你會罵我呢。

怎么會, Doug Lea 大神在 JDK 源碼注釋中給出的就是這樣的例子,這是最根本的功能。你在這個基礎上,嘗試着優化一下?

 

第二版

小宇:還能怎么優化呢?這不已經用一個工具類實現了異步執行了嘛!

閃客:我問你一個問題,假如有 10000 個人都調用這個工具類提交任務,那就會創建 10000 個線程來執行,這肯定不合適吧!能不能控制一下線程的數量呢?

小宇:這不難,我可以把這個任務 r 丟到一個 tasks 隊列中,然后只啟動一個線程,就叫它 Worker 線程吧,不斷從 tasks 隊列中取任務,執行任務。這樣無論調用者調用多少次,永遠就只有一個 Worker 線程在運行,像這樣。

閃客:太棒了,這個設計有了三個重大的意義:

1. 控制了線程數量。

2. 隊列不但起到了緩沖的作用,還將任務的提交與執行解耦了。

3. 最重要的一點是,解決了每次重復創建和銷毀線程帶來的系統開銷。

小宇:哇真的么,這么小的改動有這么多意義呀。

閃客:那當然,不過只有一個后台的工作線程 Worker 會不會少了點?還有如果這個 tasks 隊列滿了怎么辦呢?

 

第三版

小宇:哦,的確,只有一個線程在某些場景下是很吃力的,那我把 Worker 線程的數量增加?

閃客:沒錯,Worker 線程的數量要增加,但是具體數量要讓使用者決定,調用時傳入,就叫核心線程數 corePoolSize 吧。

小宇:好的,那我這樣設計。

1. 初始化線程池時,直接啟動 corePoolSize 個工作線程 Worker 先跑着。

2. 這些 Worker 就是死循環從隊列里取任務然后執行。

3. execute 方法仍然是直接把任務放到隊列,但隊列滿了之后直接拋棄

閃客:太完美了,獎勵你一塊費列羅吧。

小宇:哈哈謝謝,那我先吃一會兒哈。 

閃客:好,你邊吃我邊說。現在我們已經實現了一個至少不那么丑陋的線程池了,但還有幾處小瑕疵,比如初始化的時候,就創建了一堆 Worker 線程在那空跑着,假如此時並沒有異步任務提交過來執行,這就有點浪費了。

小宇:哦好像是誒!

閃客:還有,你這隊列一滿,就直接把新任務丟棄了,這樣有些粗暴,能不能讓調用者自己決定該怎么處理呢?

小宇:哎呀,想不到我這么溫柔的妹紙居然寫出了這么粗暴的代碼。

閃客:額,你先把費列羅咽下去吧。

 

第四版

小宇:我吃完了,現在腦子有點不夠用了,得先消化消化食物,要不你幫我分析分析吧。

閃客:好的,現在我們做出如下改進。

1. 按需創建Worker:剛初始化線程池時,不再立刻創建 corePoolSize 個工作線程,而是等待調用者不斷提交任務的過程中,逐漸把工作線程 Worker 創建出來,等數量達到 corePoolSize 時就停止,把任務直接丟到隊列里。那就必然要用一個屬性記錄已經創建出來的工作線程數量,就叫 workCount 吧。

2. 加拒絕策略:實現上就是增加一個入參,類型是一個接口 RejectedExecutionHandler,由調用者決定實現類,以便在任務提交失敗后執行 rejectedExecution 方法。

3. 增加線程工廠:實現上就是增加一個入參,類型是一個接口 ThreadFactory,增加工作線程時不再直接 new 線程,而是調用這個由調用者傳入的 ThreadFactory 實現類的 newThread 方法。

就像下面這樣。

小宇:哇,還是你厲害,這一版應該很完美了吧? 閃客:不不不,離完美還差得很遠,接下來的改進,由你來想吧,我這里可以給你一個提示

彈性思維


第五版

小宇:彈性思維?哈哈閃客你這術語說的真是越來越不像人話了

閃客:咳咳

小宇:哦,我是說你肯定是指我這個代碼寫的沒有彈性,對吧?可是彈性是指什么呢?

閃客:簡單說,在這個場景里,彈性就是在任務提交比較頻繁,和任務提交非常不頻繁這兩種情況下,你這個代碼是否有問題?

小宇:emmm 讓我想想,我這個線程池,當提交任務的量突增時,工作線程和隊列都被占滿了,就只能走拒絕策略,其實就是被丟棄掉

閃客:是的

小宇:這樣的確是太硬了,誒不過我想了下,調用方可以通過設置很大的核心線程數 corePoolSize 來解決這個問題呀。

閃客:的確是可以,但一般場景下 QPS 高峰期都很短,而為了這個很短暫的高峰,設置很大的核心線程數,簡直太浪費資源了,你看上面的圖不覺得眼暈么?

小宇:是呀,那怎么辦呢,太大了也不行,太小了也不行。

閃客:我們可以發明一個新的屬性,叫最大線程數 maximumPoolSize 。當核心線程數和隊列都滿了時,新提交的任務仍然可以通過創建新的工作線程(叫它 非核心線程 ),直到工作線程數達到 maximumPoolSize 為止,這樣就可以緩解一時的高峰期了,而用戶也不用設置過大的核心線程數。

小宇:哦好像有點感覺了,可是具體怎么操作呢? 閃客:想象力不行呀小宇,那你看下面的演示。

1. 開始的時候和上一版一樣,當 workCount < corePoolSize 時,通過創建新的 Worker 來執行任務。

2. 當 workCount >= corePoolSize 就停止創建新線程,把任務直接丟到隊列里。

3. 但當隊列已滿且仍然 workCount < maximumPoolSize 時,不再直接走拒絕策略,而是創建非核心線程,直到 workCount = maximumPoolSize,再走拒絕策略。

小宇:哎呀,我怎么沒想到,這樣 corePoolSize 就負責平時大多數情況所需要的工作線程數,而 maximumPoolSize 就負責在高峰期臨時擴充工作線程數。

閃客:沒錯,高峰時期的彈性搞定了,那自然就還要考慮低谷時期。當長時間沒有任務提交時,核心線程與非核心線程都一直空跑着,浪費資源。我們可以給非核心線程設定一個超時時間 keepAliveTime ,當這么長時間沒能從隊列里獲取任務時,就不再等了,銷毀線程。

小宇:嗯,這回咱們的線程池在 QPS 高峰時可以臨時擴容,QPS 低谷時又可以及時回收線程(非核心線程)而不至於浪費資源,真的顯得十分 Q 彈呢。

閃客:是呀是呀。誒不對,怎么又變成我說了,不是說這一版你來思考么?

小宇:我也想啊,但你這一講技術就自說自話的毛病老是不改,我有啥辦法。 閃客:額抱歉抱歉,那接下來你總結一下我們的線程池吧

 

總結

小宇:嗯好的,首先它的構造方法是這個樣子滴

 

public FlashExecutor(
        int corePoolSize,
        int maximumPoolSize,
        long keepAliveTime,
        TimeUnit unit,
        BlockingQueue<Runnable> workQueue,
        ThreadFactory threadFactory,
        RejectedExecutionHandler handler) 
{
    ... // 省略一些參數校驗
    this.corePoolSize = corePoolSize;
    this.maximumPoolSize = maximumPoolSize;
    this.workQueue = workQueue;
    this.keepAliveTime = unit.toNanos(keepAliveTime);
    this.threadFactory = threadFactory;
    this.handler = handler;
}

 

這些參數分別是

int corePoolSize:核心線程數

int maximumPoolSize:最大線程數

long keepAliveTime:非核心線程的空閑時間

TimeUnit unit:空閑時間的單位

BlockingQueue<Runnable> workQueue:任務隊列(線程安全的阻塞隊列)

ThreadFactory threadFactory:線程工廠

RejectedExecutionHandler handler:拒絕策略

整個任務的提交流程是

閃客:不錯不錯,這可是你自己總結的喲,現在還用我給你講什么是線程池了么?

小宇:啊天呢,我才發現這似乎就是我一直弄不清楚的線程池的參數和原理呢!

閃客:沒錯,而且最后一版代碼的構造方法,就是 Java 面試常考的  ThreadPoolExecutor 最長的那個構造方法,參數名都沒變。

小宇:哇,太贊了!我都忘了一開始我想干嘛了,嘻嘻。

閃客:哈哈,不知不覺學到了技術才爽呢,對吧?晚飯時間快到了,要不要一塊去吃山西面館呀?

小宇:哦,那家店餐桌的顏色我不太喜歡,下次吧。

閃客:哦好吧。

后記


線程池是面試常考的知識點,網上很多文章都是直接從它那有 7 個參數的構造方法講起,強行把各個參數的含義說給你聽,讓人雲里霧里。 希望讀者讀完本篇文章后,線程池的這些參數不再是死記硬背,而是像本文中這些動圖一樣在你的腦中活靈活現,這樣就能永遠記住他們啦~ 本文中各個版本都有對應代碼,在公眾號 低並發編程 后台回復 線程池 即可獲取。


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM