阻塞和非阻塞,同步和異步 總結【轉】


轉自:https://www.cnblogs.com/George1994/p/6702084.html

阻塞和非阻塞,同步和異步

1 例子

故事:老王燒開水。

出場人物:老張,水壺兩把(普通水壺,簡稱水壺;會響的水壺,簡稱響水壺)。

老王想了想,有好幾種等待方式

1.老王用水壺煮水,並且站在那里不管水開沒開,每隔一定時間看看水開了沒。-同步阻塞

老王想了想,這種方法不夠聰明。

2.老王還是用水壺煮水,不再傻傻的站在那里看水開,跑去寢室上網但是還是會每隔一段時間過來看看水開了沒有,水沒有開就走人。-同步非阻塞

老王想了想,現在的方法聰明了些,但是還是不夠好。

3.老王這次使用高大上的響水壺來煮水,站在那里但是不會再每隔一段時間去看水開,而是等水開了,水壺會自動的通知他。-異步阻塞

老王想了想,不會呀,既然水壺可以通知我,那我為什么還要傻傻的站在那里等呢,嗯,得換個方法。

4.老王還是使用響水壺煮水,跑到客廳上網去,等着響水壺自己把水煮熟了以后通知他。-異步非阻塞

老王豁然,這下感覺輕松了很多。


  • 同步和異步

    同步就是燒開水,需要自己去輪詢(每隔一段時間去看看水開了沒),異步就是水開了,然后水壺會通知你水已經開了,你可以回來處理這些開水了。
    同步和異步是相對於操作結果來說,會不會等待結果返回。

  • 阻塞和非阻塞

    阻塞就是說在煮水的過程中,你不可以去干其他的事情,非阻塞就是在同樣的情況下,可以同時去干其他的事情。阻塞和非阻塞是相對於線程是否被阻塞。

其實,這兩者存在本質的區別,它們的修飾對象是不同的。阻塞和非阻塞是指進程訪問的數據如果尚未就緒,進程是否需要等待,簡單說這相當於函數內部的實現區別,也就是未就緒時是直接返回還是等待就緒。
而同步和異步是指訪問數據的機制,同步一般指主動請求並等待I/O操作完畢的方式,當數據就緒后在讀寫的時候必須阻塞,異步則指主動請求數據后便可以繼續處理其它任務,隨后等待I/O,操作完畢的通知,這可以使進程在數據讀寫時也不阻塞。

2 詳細介紹

網絡IO的模型大致包括下面幾種

  • 同步模型(synchronous IO)
    • 阻塞IO(bloking IO)
    • 非阻塞IO(non-blocking IO)
    • 多路復用IO(multiplexing IO)
    • 信號驅動式IO(signal-driven IO)
  • 異步IO(asynchronous IO)
    • 異步IO

網絡IO的本質是socket的讀取,socket在linux系統被抽象為流,IO可以理解為對流的操作。對於一次IO訪問,數據會先被拷貝到操作系統內核的緩沖區中,然后才會從操作系統內核的緩沖區拷貝到應用程序的地址空間,所以一般會經歷兩個階段:

  1. 等待所有數據都准備好或者一直在等待數據,有數據的時候將數據拷貝到系統內核;
  2. 將內核緩存中數據拷貝到用戶進程中;

對於socket流而言:

  1. 等待網絡上的數據分組到達,然后被復制到內核的某個緩沖區;
  2. 把數據從內核緩沖區復制到應用進程緩沖區中;

2.1 阻塞IO

2.1.1 介紹

這也是最常用的模型,默認情況下所有的套接字都是 阻塞 的;

我們把recvfrom函數視為系統調用,因為我們正區分進程和內核,系統調用一般都會從在應用進程空間中運行切換到內核空間中運行,一段時間后又再切換回來;

我們可以從圖中看到,應用進程從 進行系統調用復制數據報到應用進程的緩沖區完成 的整段時間內是被阻塞的;在這個過程中,要么正確到達,要么系統調用被信號打斷;直到數據報被復制到用戶進程完成后,用戶進程才解除阻塞的狀態,當然,這是用戶進程自己進行的阻塞;

2.1.2 優點和缺點

  • 優點:能夠及時返回數據,無延遲;方便調試;
  • 缺點:需要付出等待的代價;

2.2 非阻塞IO

2.2.1 介紹

非阻塞,當所請求的I/O操作非得把當前進程設置成睡眠才能完成時,不要把當前進程設置成睡眠,而是返回一個錯誤信息(數據報沒有准備好的情況下),此時當前進程可以做其它的事情,不用阻塞;

從圖中可以得知,前三次系統調用時都沒有數據可以返回,內核均返回一個 EWOULDBLOCK,並且不會阻塞當前進程,直到第四次詢問內核緩沖區是否有數據的時候,此時內核緩沖區中已經有一個准備好的數據,因此將內核數據復制到用戶空間,此時系統調用則返回成功;

當一個應用進程像這樣對一個非阻塞socket循環調用 recv/recvfrom 時,則稱為輪詢;應用進程持續輪詢內核,以查看某個操作是否就緒,這么做往往消耗大量的CPU時間。

2.2.2 優點和缺點

  • 優點:相較於阻塞模型,非阻塞不用再等待任務,而是把時間花費到其它任務上,也就是這個當前線程同時處理多個任務;

  • 缺點:導致任務完成的響應延遲增大了,因為每隔一段時間才去執行詢問的動作,但是任務可能在兩個詢問動作的時間間隔內完成,這會導致整體數據吞吐量的降低。

2.3 IO多路復用

2.3.1 介紹

有了I/O復用,我們就可以調用 select或poll,讓其阻塞在兩個系統調用(1.詢問數據是否准備好並且直到數據准備好才返回;2.內核是否把數據全部復制完成到用戶進程)中的某一個之上

圖中阻塞於 select 調用,等待數據報套接字變為可讀。當select返回套接字可讀這一條件的時候,則調用 recvfrom 把所讀數據報復制到應用進程緩沖區;

之前的同步非阻塞方式需要用戶進程不停的輪詢,但是IO多路復用不需要不停的輪詢,而是派別人去幫忙循環查詢多個任務的完成狀態,UNIX/Linux 下的 select、poll、epoll 就是干這個的;select調用是內核級別的,select輪詢相對非阻塞的輪詢的區別在於---前者可以等待多個socket,能實現同時對多個IO端口進行監聽,當其中任何一個socket的數據准好了,就能返回進行可讀,然后進程再進行recvform系統調用,將數據由內核拷貝到用戶進程,當然這個過程是阻塞的。select或poll調用之后,會阻塞進程,與blocking IO阻塞不同在於,此時的select不是等到socket數據全部到達再處理, 而是有了一部分數據(網絡上的數據是分組到達的)就會調用用戶進程來處理。如何知道有一部分數據到達了呢?監視的事情交給了內核,內核負責數據到達的處理。

我認為上面那句話中存在兩個重要點:1.對多個socket進行監聽,只要任何一個socket數據准備好就返回可讀;2.不等一個socket數據全部到達再處理,而是一部分socket的數據到達了就通知用戶進程;

其實 select、poll、epoll 的原理就是不斷的遍歷所負責的所有的socket完成狀態,當某個socket有數據到達了,就返回可讀並通知用戶進程來處理;

2.3.2 優點和缺點

  • 優點:能夠同時處理多個連接,系統開銷小,系統不需要創建新的額外進程或者線程,也不需要維護這些進程和線程的運行,降低了系統的維護工作量,節省了系統資源。
  • 缺點:如果處理的連結數目不高的話,使用select/epoll的web server不一定比使用multi-threading + blocking IO的web server性能更好,可能延遲還更大。(因為阻塞可以保證沒有延遲,但是多路復用是處理先存在的數據,所以數據的順序則不管,導致處理一個完整的任務的時間上有延遲)

2.3.3 同步非阻塞和多線程+同步阻塞

高並發的程序一般使用同步非阻塞方式而非多線程 + 同步阻塞方式。要理解這一點,首先要扯到並發和並行的區別。比如去某部門辦事需要依次去幾個窗口,辦事大廳里的人數就是並發數,而窗口個數就是並行度。也就是說並發數是指同時進行的任務數(如同時服務的 HTTP 請求),而並行數是可以同時工作的物理資源數量(如 CPU 核數)。通過合理調度任務的不同階段,並發數可以遠遠大於並行度,這就是區區幾個 CPU 可以支持上萬個用戶並發請求的奧秘。在這種高並發的情況下,為每個任務(用戶請求)創建一個進程或線程的開銷非常大。而同步非阻塞方式可以把多個 IO 請求丟到后台去,這就可以在一個進程里服務大量的並發 IO 請求。

2.4 信號驅動式I/O模型

首先開啟套接字的信號驅動式IO功能,並且通過 sigaction 系統調用安裝一個信號處理函數,該函數調用將立即返回,當前進程沒有被阻塞,繼續工作;當數據報准備好的時候,內核則為該進程產生 SIGIO 的信號,隨后既可以在信號處理函數中調用 recvfrom 讀取數據報,並且通知主循環數據已經准備好等待處理,也可以通知主循環讓它讀取數據報;(其實就是一個待讀取的通知和待處理的通知);

2.5 異步式I/O模型

我們調用 aio_read 函數,給內核傳遞描述符、緩沖區指針、緩沖區大小和文件偏移,並且告訴內核當整個操作完成時如何通知我們。該函數調用后立即返回,不被阻塞;

2.6 比較

推薦文章
IO多路復用機制詳解
I/O模型與多路復用
聊聊Linux 五種IO模型
聊聊IO多路復用之select、poll、epoll詳解


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM