漫談五種IO模型

本文轉載自查看原文 2019-04-08 17:54 624 JVM/ linux

閱讀目錄

1 基礎知識回顧
2 I/O模式
3 事件驅動編程模型

　　網絡編程里常聽到阻塞IO、非阻塞IO、同步IO、異步IO等概念，搞清楚這些概念之前，還得先回顧一些基礎的概念。

1 基礎知識回顧

注意：咱們下面說的都是Linux環境下，跟Windows不一樣哈。

1.1 用戶空間和內核空間

　　現在操作系統都采用虛擬尋址，處理器先產生一個虛擬地址，通過地址翻譯成物理地址（內存的地址），再通過總線的傳遞，最后處理器拿到某個物理地址返回的字節。

　　對32位操作系統而言，它的尋址空間（虛擬存儲空間）為4G（2的32次方）。操作系統的核心是內核，獨立於普通的應用程序，可以訪問受保護的內存空間，也有訪問底層硬件設備的所有權限。為了保證用戶進程不能直接操作內核（kernel），保證內核的安全，操心系統將虛擬空間划分為兩部分，一部分為內核空間，一部分為用戶空間。針對linux操作系統而言，將最高的1G字節（從虛擬地址0xC0000000到0xFFFFFFFF），供內核使用，稱為內核空間，而將較低的3G字節（從虛擬地址0x00000000到0xBFFFFFFF），供各個進程使用，稱為用戶空間。

補充：地址空間就是一個非負整數地址的有序集合。如{0,1,2...}。

1.2 進程上下文切換（進程切換）

　　為了控制進程的執行，內核必須有能力掛起正在CPU上運行的進程，並恢復以前掛起的某個進程的執行。這種行為被稱為進程切換（也叫調度）。因此可以說，任何進程都是在操作系統內核的支持下運行的，是與內核緊密相關的。

　　從一個進程的運行轉到另一個進程上運行，這個過程中經過下面這些變化：
　　1. 保存當前進程A的上下文。

　　上下文就是內核再次喚醒當前進程時所需要的狀態，由一些對象（程序計數器、狀態寄存器、用戶棧等各種內核數據結構）的值組成。

　　這些值包括描繪地址空間的頁表、包含進程相關信息的進程表、文件表等。
　　2. 切換頁全局目錄以安裝一個新的地址空間。

　　　　...
　　3. 恢復進程B的上下文。

　　可以理解成一個比較耗資源的過程。

1.3 進程的阻塞

　　正在執行的進程，由於期待的某些事件未發生，如請求系統資源失敗、等待某種操作的完成、新數據尚未到達或無新工作做等，則由系統自動執行阻塞原語(Block)，使自己由運行狀態變為阻塞狀態。可見，進程的阻塞是進程自身的一種主動行為，也因此只有處於運行態的進程（獲得CPU），才可能將其轉為阻塞狀態。當進程進入阻塞狀態，是不占用CPU資源的。

1.4 文件描述符

　　文件描述符（File descriptor）是計算機科學中的一個術語，是一個用於表述指向文件的引用的抽象化概念。

　　文件描述符在形式上是一個非負整數。實際上，它是一個索引值，指向內核為每一個進程所維護的該進程打開文件的記錄表。當程序打開一個現有文件或者創建一個新文件時，內核向進程返回一個文件描述符。在程序設計中，一些涉及底層的程序編寫往往會圍繞着文件描述符展開。但是文件描述符這一概念往往只適用於UNIX、Linux這樣的操作系統。

1.5 直接I/O和緩存I/O

　　緩存 I/O 又被稱作標准 I/O，大多數文件系統的默認 I/O 操作都是緩存 I/O。在 Linux 的緩存 I/O 機制中，以write為例，數據會先被拷貝進程緩沖區，在拷貝到操作系統內核的緩沖區中，然后才會寫到存儲設備中。

緩存I/O的write：

直接I/O的write：（少了拷貝到進程緩沖區這一步）

write過程中會有很多次拷貝，知道數據全部寫到磁盤。好了，准備知識概略復習了一下，開始探討IO模式。

2 I/O模式

　　對於一次IO訪問（這回以read舉例），數據會先被拷貝到操作系統內核的緩沖區中，然后才會從操作系統內核的緩沖區拷貝到應用程序的緩沖區，最后交給進程。所以說，當一個read操作發生時，它會經歷兩個階段：
　　1. 等待數據准備 (Waiting for the data to be ready)
　　2. 將數據從內核拷貝到進程中 (Copying the data from the kernel to the process)

正式因為這兩個階段，linux系統產生了下面五種網絡模式的方案：
　　1. 阻塞 I/O（blocking IO）
　　2. 非阻塞 I/O（nonblocking IO）
　　3. I/O 多路復用（ IO multiplexing）
　　4. 信號驅動 I/O（ signal driven IO）
　　5. 異步 I/O（asynchronous IO）

注：由於signal driven IO在實際中並不常用，所以我這只提及剩下的四種IO 模型。

首先引用levin的回答讓我們理清楚五種IO模型

1.阻塞I/O模型
老李去火車站買票，排隊三天買到一張退票。
耗費：在車站吃喝拉撒睡 3天，其他事一件沒干。

2.非阻塞I/O模型
老李去火車站買票，隔12小時去火車站問有沒有退票，三天后買到一張票。耗費：往返車站6次，路上6小時，其他時間做了好多事。

3.I/O復用模型
1.select/poll
老李去火車站買票，委托黃牛，然后每隔6小時電話黃牛詢問，黃牛三天內買到票，然后老李去火車站交錢領票。
耗費：往返車站2次，路上2小時，黃牛手續費100元，打電話17次
2.epoll
老李去火車站買票，委托黃牛，黃牛買到后即通知老李去領，然后老李去火車站交錢領票。
耗費：往返車站2次，路上2小時，黃牛手續費100元，無需打電話

4.信號驅動I/O模型
老李去火車站買票，給售票員留下電話，有票后，售票員電話通知老李，然后老李去火車站交錢領票。
耗費：往返車站2次，路上2小時，免黃牛費100元，無需打電話

5.異步I/O模型
老李去火車站買票，給售票員留下電話，有票后，售票員電話通知老李並快遞送票上門。
耗費：往返車站1次，路上1小時，免黃牛費100元，無需打電話

2.1 block I/O模型（阻塞I/O）

阻塞I/O模型示意圖：

read為例：

（1）進程發起read，進行recvfrom系統調用；

（2）內核開始第一階段，准備數據（從磁盤拷貝到緩沖區），進程請求的數據並不是一下就能准備好；准備數據是要消耗時間的；

（3）與此同時，進程阻塞（進程是自己選擇阻塞與否），等待數據ing；

（4）直到數據從內核拷貝到了用戶空間，內核返回結果，進程解除阻塞。

也就是說，內核准備數據和數據從內核拷貝到進程內存地址這兩個過程都是阻塞的。

2.2 non-block（非阻塞I/O模型）

可以通過設置socket使其變為non-blocking。當對一個non-blocking socket執行讀操作時，流程是這個樣子：

　　（1）當用戶進程發出read操作時，如果kernel中的數據還沒有准備好；

　　（2）那么它並不會block用戶進程，而是立刻返回一個error，從用戶進程角度講，它發起一個read操作后，並不需要等待，而是馬上就得到了一個結果；

　　（3）用戶進程判斷結果是一個error時，它就知道數據還沒有准備好，於是它可以再次發送read操作。一旦kernel中的數據准備好了，並且又再次收到了用戶進程的system call；

　　（4）那么它馬上就將數據拷貝到了用戶內存，然后返回。

　　所以，nonblocking IO的特點是用戶進程在內核准備數據的階段需要不斷的主動詢問數據好了沒有。

2.3 I/O多路復用

　　　　I/O多路復用實際上就是用select, poll, epoll監聽多個io對象，當io對象有變化（有數據）的時候就通知用戶進程。好處就是單個進程可以處理多個socket。當然具體區別我們后面再討論，現在先來看下I/O多路復用的流程：

　　（1）當用戶進程調用了select，那么整個進程會被block；

（2）而同時，kernel會“監視”所有select負責的socket；

　　（3）當任何一個socket中的數據准備好了，select就會返回；

　　（4）這個時候用戶進程再調用read操作，將數據從kernel拷貝到用戶進程。

　　所以，I/O 多路復用的特點是通過一種機制一個進程能同時等待多個文件描述符，而這些文件描述符（套接字描述符）其中的任意一個進入讀就緒狀態，select()函數就可以返回。

　　這個圖和blocking IO的圖其實並沒有太大的不同，事實上，還更差一些。因為這里需要使用兩個system call (select 和 recvfrom)，而blocking IO只調用了一個system call (recvfrom)。但是，用select的優勢在於它可以同時處理多個connection。

　　所以，如果處理的連接數不是很高的話，使用select/epoll的web server不一定比使用多線程 + 阻塞 IO的web server性能更好，可能延遲還更大。

　　select/epoll的優勢並不是對於單個連接能處理得更快，而是在於能處理更多的連接。）

　　在IO multiplexing Model中，實際中，對於每一個socket，一般都設置成為non-blocking，但是，如上圖所示，整個用戶的process其實是一直被block的。只不過process是被select這個函數block，而不是被socket IO給block。

2.4 asynchronous I/O（異步 I/O）

　　真正的異步I/O很牛逼，流程大概如下：

（1）用戶進程發起read操作之后，立刻就可以開始去做其它的事。

（2）而另一方面，從kernel的角度，當它受到一個asynchronous read之后，首先它會立刻返回，所以不會對用戶進程產生任何block。

（3）然后，kernel會等待數據准備完成，然后將數據拷貝到用戶內存，當這一切都完成之后，kernel會給用戶進程發送一個signal，告訴它read操作完成了。

2.5 小結

（1）blocking和non-blocking的區別

　　調用blocking IO會一直block住對應的進程直到操作完成，而non-blocking IO在kernel還准備數據的情況下會立刻返回。

（2）synchronous IO和asynchronous IO的區別

　　在說明synchronous IO和asynchronous IO的區別之前，需要先給出兩者的定義。POSIX的定義是這樣子的：

　　　　- A synchronous I/O operation causes the requesting process to be blocked until that I/O operation completes;
　　　　- An asynchronous I/O operation does not cause the requesting process to be blocked;

　　兩者的區別就在於synchronous IO做”IO operation”的時候會將process阻塞。按照這個定義，之前所述的blocking IO，non-blocking IO，IO multiplexing都屬於synchronous IO。

　　有人會說，non-blocking IO並沒有被block啊。這里有個非常“狡猾”的地方，定義中所指的”IO operation”是指真實的IO操作，就是例子中的recvfrom這個system call。non-blocking IO在執行recvfrom這個system call的時候，如果kernel的數據沒有准備好，這時候不會block進程。但是，當kernel中數據准備好的時候，recvfrom會將數據從kernel拷貝到用戶內存中，這個時候進程是被block了，在這段時間內，進程是被block的。

　　而asynchronous IO則不一樣，當進程發起IO 操作之后，就直接返回再也不理睬了，直到kernel發送一個信號，告訴進程說IO完成。在這整個過程中，進程完全沒有被block。

（3）non-blocking IO和asynchronous IO的區別

　　可以發現non-blocking IO和asynchronous IO的區別還是很明顯的。

　　--在non-blocking IO中，雖然進程大部分時間都不會被block，但是它仍然要求進程去主動的check，並且當數據准備完成以后，也需要進程主動的再次調用recvfrom來將數據拷貝到用戶內存。

　　--而asynchronous IO則完全不同。它就像是用戶進程將整個IO操作交給了他人（kernel）完成，然后他人做完后發信號通知。在此期間，用戶進程不需要去檢查IO操作的狀態，也不需要主動的去拷貝數據。

3 事件驅動編程模型

3.1論事件驅動

　　通常，我們寫服務器處理模型的程序時，有以下幾種模型：

　　　　（1）每收到一個請求，創建一個新的進程，來處理該請求；

　　　　（2）每收到一個請求，創建一個新的線程，來處理該請求；

　　　　（3）每收到一個請求，放入一個事件列表，讓主進程通過非阻塞I/O方式來處理請求

　　上面的幾種方式，各有千秋：

　　　　第（1）中方法，由於創建新的進程:實現比較簡單，但開銷比較大，導致服務器性能比較差。

　　　　第（2）種方式，由於要涉及到線程的同步，有可能會面臨死鎖等問題。

　　　　第（3）種方式，在寫應用程序代碼時，邏輯比前面兩種都復雜。

　　綜合考慮各方面因素，一般普遍認為第（3）種方式是大多數網絡服務器采用的方式。

3.2 看圖說話講事件驅動模型

　　在UI編程中，常常要對鼠標點擊進行相應，首先如何獲得鼠標點擊呢？
　　方式一：創建一個線程，該線程一直循環檢測是否有鼠標點擊，那么這個方式有以下幾個缺點：
　　　　1. CPU資源浪費，可能鼠標點擊的頻率非常小，但是掃描線程還是會一直循環檢測，這會造成很多的CPU資源浪費；如果掃描鼠標點擊的接口是阻塞的呢？
　　　　2. 如果是堵塞的，又會出現下面這樣的問題，如果我們不但要掃描鼠標點擊，還要掃描鍵盤是否按下，由於掃描鼠標時被堵塞了，那么可能永遠不會去掃描鍵盤；
　　　　3. 如果一個循環需要掃描的設備非常多，這又會引來響應時間的問題；
　　所以，該方式是非常不好的。
方式二：就是事件驅動模型
　　目前大部分的UI編程都是事件驅動模型，如很多UI平台都會提供onClick()事件，這個事件就代表鼠標按下事件。事件驅動模型大體思路如下：
　　　　1. 有一個事件（消息）隊列；
　　　　2. 鼠標按下時，往這個隊列中增加一個點擊事件（消息）；
　　　　3. 有個循環，不斷從隊列取出事件，根據不同的事件，調用不同的函數，如onClick()、onKeyDown()等；
　　　　4. 事件（消息）一般都各自保存各自的處理函數指針，這樣，每個消息都有獨立的處理函數；

　　事件驅動編程是一種網絡編程范式，這里程序的執行流由外部事件來決定。它的特點是包含一個事件循環，當外部事件發生時使用回調機制來觸發相應的處理。另外兩種常見的編程范式是（單線程）同步以及多線程編程。

　　讓我們用例子來比較和對比一下單線程、多線程以及事件驅動編程模型。下圖展示了隨着時間的推移，這三種模式下程序所做的工作。這個程序有3個任務需要完成，每個任務都在等待I/O操作時阻塞自身。阻塞在I/O操作上所花費的時間已經用灰色框標示出來了。

　　在單線程同步模型中，任務按照順序執行。如果某個任務因為I/O而阻塞，其他所有的任務都必須等待，直到它完成之后它們才能依次執行。這種明確的執行順序和串行化處理的行為是很容易推斷得出的。如果任務之間並沒有互相依賴的關系，但仍然需要互相等待的話這就使得程序不必要的降低了運行速度。

　　在多線程版本中，這3個任務分別在獨立的線程中執行。這些線程由操作系統來管理，在多處理器系統上可以並行處理，或者在單處理器系統上交錯執行。這使得當某個線程阻塞在某個資源的同時其他線程得以繼續執行。與完成類似功能的同步程序相比，這種方式更有效率，但程序員必須寫代碼來保護共享資源，防止其被多個線程同時訪問。多線程程序更加難以推斷，因為這類程序不得不通過線程同步機制如鎖、可重入函數、線程局部存儲或者其他機制來處理線程安全問題，如果實現不當就會導致出現微妙且令人痛不欲生的bug。

　　在事件驅動版本的程序中，3個任務交錯執行，但仍然在一個單獨的線程控制中。當處理I/O或者其他昂貴的操作時，注冊一個回調到事件循環中，然后當I/O操作完成時繼續執行。回調描述了該如何處理某個事件。事件循環輪詢所有的事件，當事件到來時將它們分配給等待處理事件的回調函數。這種方式讓程序盡可能的得以執行而不需要用到額外的線程。事件驅動型程序比多線程程序更容易推斷出行為，因為程序員不需要關心線程安全問題。

當我們面對如下的環境時，事件驅動模型通常是一個好的選擇：

程序中有許多任務，而且…
任務之間高度獨立（因此它們不需要互相通信，或者等待彼此）而且…
在等待事件到來時，某些任務會阻塞。

　　當應用程序需要在任務間共享可變的數據時，這也是一個不錯的選擇，因為這里不需要采用同步處理。

　　網絡應用程序通常都有上述這些特點，這使得它們能夠很好的契合事件驅動編程模型。

免責聲明！

本站轉載的文章為個人學習借鑒使用，本站對版權不負任何法律責任。如果侵犯了您的隱私權益，請聯系本站郵箱yoyou2525@163.com刪除。

猜您在找 Linux IO模型漫談（1） Linux IO模型漫談（2） Linux IO模型漫談（4）- 非阻塞IO Linux IO模型漫談（6）- 信號驅動IO模型 Linux IO模型漫談（5）- IO復用模型之select IO概念和五種IO模型 Linux五種IO模型 5種IO模型 IO 的五種模型是什么 Linux五種IO模型