Golang 協程調度


一、線程模型

  • N:1模型,N個用戶空間線程在1個內核空間線程上運行。優勢是上下文切換非常快但是無法利用多核系統的優點。
  • 1:1模型,1個內核空間線程運行一個用戶空間線程。這種充分利用了多核系統的優勢但是上下文切換非常慢,因為每一次調度都會在用戶態和內核態之間切換。(POSIX線程模型(pthread),Java)
  • M:N模型, 每個用戶線程對應多個內核空間線程,同時也可以一個內核空間線程對應多個用戶空間線程。Go打算采用這種模型,使用任意個內核模型管理任意個goroutine。這樣結合了以上兩種模型的優點,但缺點就是調度的復雜性。

下面看看golang的協程調度

  • M:一個用戶空間線程,同時對應一個內核線程,類似posix pthread
  • P:代表運行的上下文環境, 也就是我們上一節實現的調度器,一個調度器也會對應一個就緒隊列
  • G:goroutine,即協程

二、調度模型簡介

groutine能擁有強大的並發實現是通過GPM調度模型實現,下面就來解釋下goroutine的調度模型。

Go的調度器內部有三個重要的結構:M,P,G
M:M是對內核級線程的封裝,數量對應真實的CPU數,一個M就是一個線程,goroutine就是跑在M之上的;M是一個很大的結構,里面維護小對象內存cache(mcache)、當前執行的goroutine、隨機數發生器等等非常多的信息
G:代表一個goroutine,它有自己的棧,instruction pointer和其他信息(正在等待的channel等等),用於調度。
P:P全稱是Processor,處理器,它的主要用途就是用來執行goroutine的。每個Processor對象都擁有一個LRQ(Local Run Queue),未分配的Goroutine對象保存在GRQ(Global Run Queue )中,等待分配給某一個P的LRQ中,每個LRQ里面包含若干個用戶創建的Goroutine對象。

Golang采用的是多線程模型,更詳細的說他是一個兩級線程模型,但它對系統線程(內核級線程)進行了封裝,暴露了一個輕量級的協程goroutine(用戶級線程)供用戶使用,而用戶級線程到內核級線程的調度由golang的runtime負責,調度邏輯對外透明。goroutine的優勢在於上下文切換在完全用戶態進行,無需像線程一樣頻繁在用戶態與內核態之間切換,節約了資源消耗。

調度實現

從上圖中看,有2個物理線程M,每一個M都擁有一個處理器P,每一個也都有一個正在運行的goroutine。
P的數量可以通過GOMAXPROCS()來設置,它其實也就代表了真正的並發度,即有多少個goroutine可以同時運行。
圖中灰色的那些goroutine並沒有運行,而是出於ready的就緒態,正在等待被調度。P維護着這個隊列(稱之為runqueue),
Go語言里,啟動一個goroutine很容易:go function 就行,所以每有一個go語句被執行,runqueue隊列就在其末尾加入一個
goroutine,在下一個調度點,就從runqueue中取出(如何決定取哪個goroutine?)一個goroutine執行。

 

當一個OS線程M0陷入阻塞時(如下圖),P轉而在運行M1,圖中的M1可能是正被創建,或者從線程緩存中取出。

 


當MO返回時,它必須嘗試取得一個P來運行goroutine,一般情況下,它會從其他的OS線程那里拿一個P過來,
如果沒有拿到的話,它就把goroutine放在一個global runqueue里,然后自己睡眠(放入線程緩存里)。所有的P也會周期性的檢查global runqueue並運行其中的goroutine,否則global runqueue上的goroutine永遠無法執行。
 
另一種情況是P所分配的任務G很快就執行完了(分配不均),這就導致了這個處理器P很忙,但是其他的P還有任務,此時如果global runqueue沒有任務G了,那么P不得不從其他的P里拿一些G來執行。一般來說,如果P從其他的P那里要拿任務的話,一般就拿run queue的一半,這就確保了每個OS線程都能充分的使用,如下圖:

三、GPM創建相關問題

M和P的數量如何確定?或者說何時會創建M和P?

1、P的數量:

  • 由啟動時環境變量$GOMAXPROCS或者是由runtime的方法GOMAXPROCS()決定(默認是1)。這意味着在程序執行的任意時刻都只有$GOMAXPROCS個goroutine在同時運行。

2、M的數量:

  • go語言本身的限制:go程序啟動時,會設置M的最大數量,默認10000.但是內核很難支持這么多的線程數,所以這個限制可以忽略。
  • runtime/debug中的SetMaxThreads函數,設置M的最大數量
  • 一個M阻塞了,會創建新的M。

M與P的數量沒有絕對關系,一個M阻塞,P就會去創建或者切換另一個M,所以,即使P的默認數量是1,也有可能會創建很多個M出來。

3、P何時創建:在確定了P的最大數量n后,運行時系統會根據這個數量創建n個P。

4、M何時創建:沒有足夠的M來關聯P並運行其中的可運行的G。比如所有的M此時都阻塞住了,而P中還有很多就緒任務,就會去尋找空閑的M,而沒有空閑的,就會去創建新的M。

M選擇哪一個P關聯?

  • M會選擇導致此M被創建的那個P關聯。

什么時候會切換P與M的關聯關系?

當M因系統調用而阻塞時(M上運行的G進入了系統調用的時候),M與P會分開,如果此時P的就緒隊列中還有任務,
P就會去關聯一個空閑的M,或者創建一個M進行關聯。(也就是說go不是像libtask一樣處理IO阻塞的?不確定。)

就緒的G如何選擇進入哪個P的就緒隊列?

  • 默認情況下:因為P的默認數量是1(M不一定是1),所以如果我們不改變GOMAXPROCS,無論我們在程序中用go語句創建多少個goroutine,它們都只會被塞入同一個P的就緒隊列中。
  • 有多個P的情況下:如果修改了GOMAXPROCS或者調用了runtime.GOMAXPROCS,運行時系統會把所有的G均勻的分布在各個P的就緒隊列中。

如何保證每個P的就緒隊列中都會有G

如果一個P的就緒隊列所有任務都執行完了,那么P會嘗試從其他P的就緒隊列中取出一部分到自己的就緒隊列中,以保證每個P的就緒隊列都有任務可以執行。


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM