線程和線程池並行,並發,串行,異步的理解


線程和線程池理解

關於線程和線程池的學習,我們可以從以下幾個方面入手:

第一,什么是線程,線程和進程的區別是什么

第二,線程中的基本概念,線程的生命周期

第三,單線程和多線程

第四,線程池的原理解析

第五,常見的幾種線程池的特點以及各自的應用場景

一、什么是線程,線程和進程的區別是什么

首先,進程是一個動態的過程,是一個活動的實體,簡單來說,一個應用程序的運行就可以看作是一個進程。而線程,是運行中實際任務的執行者。可以說,進程中包含了多個可以同時運行的線程。

二、什么是線程的生命周期

 第一階段新建,用new Thread() 方法創建一個新線程。

第二階段就緒,調用線程的start() 方法,線程進入就緒(Runnable)狀態,此時創建出來的線程進入搶占CPU資源的狀態,誰先搶到CPU資源,誰先開始執行。

第三階段運行,當線程搶到了CPU的執行權后,線程就進入了運行(Running)狀態,此時會執行run()方法來實現線程的操作和功能。

第四階段阻塞,在運行過程中,可能因為某些原因導致運行狀態的線程進入阻塞狀態,第一種,當線程主動調用了sleep()狀態時,線程會進入阻塞狀態,當睡眠時常過去后,就會自動進入就緒狀態。還有一種當線程進入正在等待wait()某個通知,會進入阻塞狀態,直到線程獲取notify()/notifyAll()消息,線程才會進入就緒狀態。第三種線程在等待某個輸入輸出流的完成。第四種在某個對象調用synchronized同步控制。那么,為什么會有阻塞狀態出現呢?我們都知道,CPU的資源是十分寶貴的,所以,當線程正在進行某種不確定時長的任務時,Java就會收回CPU的執行權,從而合理應用CPU的資源。

第五階段銷毀,如果線程正常執行完畢,或非常態的調用stop()方法強制性中止,或出現異常導致結束,那么線程就要被銷毀釋放資源。

三、什么是單線程和多線程

單線程顧名思義是只有一條線程在執行任務,在工作中很難遇到。多線程則是創建多條線程同時執行任務,在多線程的使用過程中,還有許多需要我們了解的概念。比如,在理解上串行,並行和並發的區別,以及在實際應用的過程中多線程的安全問題,對此,我們需要進行詳細的了解。

串行,並行,並發:

串行:多個任務,執行時一個執行完再執行另一個。 比喻:吃完飯再看視頻。

並發:多個線程在單個核心運行,同一時間一個線程運行,系統不停的切換線程,看起來是同時運行,實際上是系統不停的切換。比喻:一會跑去吃飯,一會去看電視。

並行:每個線程分配獨立的核心,線程同時運行。比喻:一邊吃飯一邊看電視。

 在單CPU系統中,系統調度在某一時刻只能讓一個線程運行,調度機制有多種形式,一般是以時間片輪詢的方式。這種不斷切換需要運行的線程讓其運行就叫並發(concurrent)。而在多CPU系統中,可以讓兩個以上的線程同時運行,這就叫作並行(parallel)。

 並發是有狀態的,“具有可論證的確定性,但是實際上具有不可確定性”;"並發"在微觀上不是同時執行的,只是把時間分成若干段,使多個進程快速交替的執行,從宏觀外來看,好像是這些進程都在執行。使用多個線程可以幫助我們在單個處理系統中實現更高的吞吐量,如果一個程序是單線程的,這個處理器在等待一個同步I/O操作完成的時候,他仍然是空閑的。在多線程系統中,當一個線程等待I/O的同時,其他的線程也可以執行。

異步與多線程:

異步和多線程並不是同一關系,異步是最終目的,多線程只是我們實現異步的一種手段。異步是調用者發送一個請求給被調用者,而調用者不用等待請求結果的返回,可以去做其他事。實現異步可以使用多線程或交給其他進程來處理。

1)多線程實現異步的好處,因為異步代碼比較難以實現,多線程相對容易,但多線程本質是同步,效率上比不上異步。

2)多線程和異步都可以實現避免線程堵塞的問題,從而提高軟件的可響應性。

3)異步操作的本質:所有的程序最終都會由計算機硬件來執行,所以為了更好的理解異步操作的本質,我們有必要了解一下它的硬件基礎。 熟悉電腦硬件的朋友肯定對DMA這個詞不陌生,硬盤、光驅的技術規格中都有明確DMA的模式指標,其實網卡、聲卡、顯卡也是有DMA功能的。DMA就是直接內存訪問的意思,也就是說,擁有DMA功能的硬件在和內存進行數據交換的時候可以不消耗CPU資源。只要CPU在發起數據傳輸時發送一個指令,硬件就開始自己和內存交換數據,在傳輸完成之后硬件會觸發一個中斷來通知操作完成。這些無須消耗CPU時間的I/O操作正是異步操作的硬件基礎。所以即使在DOS這樣的單進程(而且無線程概念)系統中也同樣可以發起異步的DMA操作。

4)線程的本質:線程不是一個計算機硬件的功能,二十操作系統提供的一種邏輯功能,線程的本質是進程中一段並發運行的代碼,所以線程需要操作系統提供CPU資源來進行運行和調度。

5)異步操作的優缺點:因為異步操作無需額外的線程負擔,並且使用回調的方式進行處理,在設計良好的情況下,處理函數可以不用使用共享變量(即使無法完全不用,最起碼可以減少共享變量的數量),減少死鎖的可能性。當然異步操作也並非完美無暇。編寫異步操作的復雜程度較高,程序主要使用回調方式進行處理,與普通人的思維方式有些初入,而且難以調試。

6)多線程的優缺點:多線程的優點很明顯,線程中的處理程序依然是順序執行,符合普通人的思維習慣,所以編程簡單。但是多線程的缺點也同樣明顯,線程的使用(濫用)會給系統帶來上下文切換的額外負擔。並且線程間的共享變量可能造成死鎖的出現。

7)適用范圍:我認為:當需要執行I/O操作時,使用異步操作比使用線程+同步I/O操作更合適。I/O操作不僅包括了直接的文件、網絡的讀寫,還包括數據庫操作、Web Service、HttpRequest以及.Net Remoting等跨進程的調用。而線程的適用范圍則是那種需要長時間CPU運算的場合,例如耗時較長的圖形處理和算法執行。但是往往由於使用線程編程的簡單和符合習慣,所以很多朋友往往會使用線程來執行耗時較長的I/O操作。這樣在只有少數幾個並發操作的時候還無傷大雅,如果需要處理大量的並發操作時就不合適了。

多核下線程數量選擇

計算密集型

  • 程序主要為復雜的邏輯判斷和復雜的運算。
  • cpu的利用率高,不用開太多的線程,開太多線程反而會因為線程切換時切換上下文而浪費資源。

IO密集型

  • 程序主要為IO操作,比如磁盤IO(讀取文件)和網絡IO(網絡請求)。
  • 因為IO操作會阻塞線程,cpu利用率不高,可以開多點線程,阻塞時可以切換到其他就緒線程,提高cpu利用率。

總結

  • 提高性能的一種方式:提高硬件水平,處理速度或核心數。
  • 另一種方式:根據實際場景,合理設置線程數,軟件上提高cpu利用率。

四、線程池的原理解析

從以上介紹我們可以看出在一個應用程序中,我們需要多次使用線程,也就意味着,我們需要多次創建和銷毀線程。而創建和銷毀線程的過程勢必消耗內存,在Java中內存資源是十分寶貴的,因此我們提出線程池的概念。

線程池:線程池是一種多線程的處理形式,處理過程中將任務添加到隊列,然后在創建線程后自動啟動這些任務。

如何創建線程池?Java中提供了創建線程池的一個類Executor

而我們創建時一般使用其子類ThreadPoolExecutor。

public ThreadPoolExecutor(int corePoolSize,  
                              int maximumPoolSize,  
                              long keepAliveTime,  
                              TimeUnit unit,  
                              BlockingQueue<Runnable> workQueue,  
                              ThreadFactory threadFactory,  
                              RejectedExecutionHandler handler)

這是其中最重要的一個構造方法,這個方法決定了創建出來的線程池的各種屬性,下面依靠一張圖來更好的理解線程池和這幾個參數:

從圖中我們可以看出,線程池中的corePoolSize就是線程池中的核心線程數,這幾個核心線程,在沒有用時也不會被回收。maximumPoolSize就是線程池中可容納的最大線程數,而KeepAliveTime就是線程池除核心線程外其他線程最長可保留時間,因為在線程池中,除了核心線程其他線程都有存活時間能被清除。Util就是計算這個時間的單位。workQueue就是等待隊列,任務可以存儲在任務隊列中等待被執行,執行是先進先出原則。threadFactory這是創建線程的線程工廠,最后一個handler是拒絕策略,我們可以在任務滿了之后,拒絕執行某些任務。

 線程池的執行流程又是怎樣的呢?

 

由圖我們可以看出,任務進來時,首先執行判斷,判斷核心線程是否處於空閑狀態,如果不是,核心線程就先就執行任務,如果核心線程已滿,則判斷任務隊列是否有地方存放該任務,若果有,就將任務保存在任務隊列中,等待執行,如果滿了,在判斷最大可容納的線程數,如果沒有超出這個數量,就開創非核心線程執行任務,如果超出了,就調用handler實現拒絕策略。 

handler的拒絕策略:

有四種:

1. AbortPolicy: 不執行任務,直接拋出異常,提示線程池已滿

2. DisCardPolicy: 不執行新任務,也不拋出異常

3. DisCardOldSetPolicy: 將消息隊列中的第一個任務替換替換為當前新進來的任務執行

4. CallerRunPolicy: 直接調用execute來執行當前任務

五、四種常見的線程池

1. CachedThreadPool: 可緩存的線程池,該線程池中沒有核心線程,非核心線程的數量為Integer.max_value,就是無限大,當有需要時創建線程來執行任務,沒有需要時回收線程,適用於耗時少,任務量大的情況。

2. ScheduledThreadPool: 周期性執行任務的線程池,按照某種特定的計划執行線程中的任務,有核心線程,但也有非核心線程,非核心線程的大小也為無限大。適用於執行周期性的任務。

3. SingleThreadPool: 只有一條線程來執行任務,適用於有順序的任務的應用場景。

4. FixedThreadPool: 定長的線程池,有核心線程,核心線程即為最大的線程數量,沒有非核心線程。當前的線程數能夠比較穩定保證一個數。能夠避免頻繁回收線程和創建線程。故適用於處理cpu密集型的任務,確保cpu在長期被工作線程使用的情況下,盡可能少的分配線程,即適用長期的任務。


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM