原生線程池這么強大,Tomcat 為何還需擴展線程池?


前言

Tomcat/Jetty 是目前比較流行的 Web 容器,兩者接受請求之后都會轉交給線程池處理,這樣可以有效提高處理的能力與並發度。JDK 提高完整線程池實現,但是 Tomcat/Jetty 都沒有直接使用。Jetty 采用自研方案,內部實現 QueuedThreadPool 線程池組件,而 Tomcat 采用擴展方案,踩在 JDK 線程池的肩膀上,擴展 JDK 原生線程池。

JDK 原生線程池可以說功能比較完善,使用也比較簡單,那為何 Tomcat/Jetty 卻不選擇這個方案,反而自己去動手實現那?

JDK 線程池

通常我們可以將執行的任務分為兩類:

  • cpu 密集型任務
  • io 密集型任務

cpu 密集型任務,需要線程長時間進行的復雜的運算,這種類型的任務需要少創建線程,過多的線程將會頻繁引起上文切換,降低任務處理處理速度。

而 io 密集型任務,由於線程並不是一直在運行,可能大部分時間在等待 IO 讀取/寫入數據,增加線程數量可以提高並發度,盡可能多處理任務。

JDK 原生線程池工作流程如下:

詳情可以查看 一文教你安全的關閉線程池,上圖假設使用 LinkedBlockingQueue

靈魂拷問:上述流程是否記錯過?在很長一段時間內,我都認為線程數量到達最大線程數,才放入隊列中。 ̄□ ̄||

上圖中可以發現只要線程池線程數量大於核心線程數,就會先將任務加入到任務隊列中,只有任務隊列加入失敗,才會再新建線程。也就是說原生線程池隊列未滿之前,最多只有核心線程數量線程。

這種策略顯然比較適合處理 cpu 密集型任務,但是對於 io 密集型任務,如數據庫查詢,rpc 請求調用等,就不是很友好了。

由於 Tomcat/Jetty 需要處理大量客戶端請求任務,如果采用原生線程池,一旦接受請求數量大於線程池核心線程數,這些請求就會被放入到隊列中,等待核心線程處理。這樣做顯然降低這些請求總體處理速度,所以兩者都沒采用 JDK 原生線程池。

解決上面的辦法可以像 Jetty 自己實現線程池組件,這樣就可以更加適配內部邏輯,不過開發難度比較大,另一種就像 Tomcat 一樣,擴展原生 JDK 線程池,實現比較簡單。

下面主要以 Tomcat 擴展線程池,講講其實現原理。

擴展線程池

首先我們從 JDK 線程池源碼出發,查看如何這個基礎上擴展。

可以看到線程池流程主要分為三步,第二步根據 queue#offer 方法返回結果,判斷是否需要新建線程。

JDK 原生隊列類型 LinkedBlockingQueue, SynchronousQueue,兩者實現邏輯不盡相同。

LinkedBlockingQueue

offer 方法內部將會根據隊列是否已滿作為判斷條件。若隊列已滿,返回 false,若隊列未滿,則將任務加入隊列中,且返回 true

SynchronousQueue

這個隊列比較特殊,內部不會儲存任何數據。若有線程將任務放入其中將會被阻塞,直到其他線程將任務取出。反之,若無其他線程將任務放入其中,該隊列取任務的方法也將會被阻塞,直到其他線程將任務放入。

對於 offer 方法來說,若有其他線程正在被取方法阻塞,該方法將會返回 true。反之,offer 方法將會返回 false。

所以若想實現適合 io 密集型任務線程池,即優先新建線程處理任務,關鍵在於 queue#offer 方法。可以重寫該方法內部邏輯,只要當前線程池數量小於最大線程數,該方法返回 false,線程池新建線程處理。

當然上述實現邏輯比較糙,下面我們就從 Tomcat 源碼查看其實現邏輯。

Tomcat 擴展線程池

Tomcat 擴展線程池直接繼承 JDK 線程池 java.util.concurrent.ThreadPoolExecutor,重寫部分方法的邏輯。另外還實現了 TaskQueue,直接繼承 LinkedBlockingQueue,重寫 offer 方法。

首先查看 Tomcat 線程池的使用方法。

可以看到 Tomcat 線程池使用方法與普通的線程池差不太多。

接着我們查看一下 Tomcat 線程池核心方法 execute 的邏輯。

execute 方法邏輯比較簡單,任務核心還是交給 Java 原生線程池處理。這里主要增加一個重試策略,如果原生線程池執行拒絕策略的情況,拋出 RejectedExecutionException 異常。這里將會捕獲,然后重新再次嘗試將任務加入到 TaskQueue ,盡最大可能執行任務。

這里需要注意 submittedCount 變量。這是 Tomcat 線程池內部一個重要的參數,它是一個 AtomicInteger 變量,將會實時統計已經提交到線程池中,但還沒有執行結束的任務。也就是說 submittedCount 等於線程池隊列中的任務數加上線程池工作線程正在執行的任務。 TaskQueue#offer 將會使用該參數實現相應的邏輯。

接着我們主要查看 TaskQueue#offer 方法邏輯。

核心邏輯在於第三步,這里如果 submittedCount 小於當前線程池線程數量,將會返回 false。上面我們講到 offer 方法返回 false,線程池將會直接創建新線程。

Dubbo 2.6.X 版本增加 EagerThreadPool,其實現原理與 Tomcat 線程池差不多,感興趣的小伙伴可以自行翻閱。

折衷方法

上述擴展方法雖然看起不是很難,但是自己實現代價可能就比較大。若不想擴展線程池運行 io 密集型任務,可以采用下面這種折衷方法。

new ThreadPoolExecutor(10, 10,
        0L, TimeUnit.MILLISECONDS,
        new LinkedBlockingQueue<Runnable>(100));

不過使用這種方式將會使 keepAliveTime 失效,線程一旦被創建,將會一直存在,比較浪費系統資源。

總結

JDK 實現線程池功能比較完善,但是比較適合運行 CPU 密集型任務,不適合 IO 密集型的任務。對於 IO 密集型任務可以間接通過設置線程池參數方式做到。

歡迎關注我的公眾號:程序通事,獲得日常干貨推送。如果您對我的專題內容感興趣,也可以關注我的博客:studyidea.cn

其他平台.png


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM