http://www.cnitblog.com/zouzheng/archive/2010/11/25/71711.html
對於面向連接的socket類型(SOCK_STREAM,SOCK_SEQPACKET)在讀寫數據之前必須建立連接,首先服務器端socket必須在一個客戶端知道的地址進行監聽,也就是創建socket之后必須調用bind綁定到一個指定的地址,然后調用int listen(int sockfd, int backlog);進行監聽。此時服務器socket允許客戶端進行連接,backlog提示沒被accept的客戶連接請求隊列的大小,系統決定實際的值,最大值定義為SOMAXCONN在頭文件<sys/socket.h>里面。如果某種原因導致服務器端進程未及時accpet客戶連接而導致此隊列滿了的話則新的客戶端連接請求被拒絕(在工作中遇到過此情況,IONA ORBIX(CORBA中間件)由於沒有配置超時時間結果在WIFI網絡中傳輸數據出現異常情況一直阻塞而無機會調用accept接受新的客戶請求,於是最終隊列滿導致新的客戶連接被拒絕)。
調用listen之后當有客戶端連接到達的時候調用int accept(int sockfd, struct sockaddr *restrict addr, socklen_t *restrict len);接受客戶端連接建立起連接返回用於連接數據傳送的socket描述符,進行監聽的socket可以用於繼續監聽客戶端的連接請求,返回的socket描述符跟監聽的socket類型一致。如果addr不為NULL,則客戶端發起連接請求的socket地址信息會通過addr進行返回。如果監聽的socket描述符為阻塞模式則accept一直會阻塞直到有客戶發起連接請求,如果監聽的socket描述符為非阻塞模式則如果當前沒有可用的客戶連接請求,則返回-1(errno設置為EAGAIN)。可以使用select函數對監聽的socket描述符進行多路分離,如果有客戶連接請求則select將監聽的socket描述符設置為可讀(注意,如果監聽的socket為阻塞模式而使用select進行多路分離則可能造成select返回可讀但是調用accept會被阻塞住的情況,原因是在調用accept之前客戶端可能主動關閉連接或者發送RST異常關閉連接,因此select最好跟非阻塞socket搭配使用)。
客戶端調用int connect(int sockfd, const struct sockaddr *addr, socklen_t len);發起對服務器的socket的連接請求,如果客戶端socket描述符為阻塞模式則會一直阻塞到連接建立或者連接失敗(注意阻塞模式的超時時間可能為75秒到幾分鍾之間),而如果為非阻塞模式,則調用connect之后如果連接不能馬上建立則返回-1(errno設置為EINPROGRESS,注意連接也可能馬上建立成功比如連接本機的服務器進程),如果沒有馬上建立返回,此時TCP的三路握手動作在背后繼續,而程序可以做其他的東西,然后調用select檢測非阻塞connect是否完成(此時可以指定select的超時時間,這個超時時間可以設置為比connect的超時時間短),如果select超時則關閉socket,然后可以嘗試創建新的socket重新連接,如果select返回非阻塞socket描述符可寫則表明連接建立成功,如果select返回非阻塞socket描述符既可讀又可寫則表明連接出錯(注意:這兒必須跟另外一種連接正常的情況區分開來,就是連接建立好了之后,服務器端發送了數據給客戶端,此時select同樣會返回非阻塞socket描述符既可讀又可寫,這時可以通過以下方法區分:
1.調用getpeername獲取對端的socket地址.如果getpeername返回ENOTCONN,表示連接建立失敗,然后用SO_ERROR調用getsockopt得到套接口描述符上的待處理錯誤;
2.調用read,讀取長度為0字節的數據.如果read調用失敗,則表示連接建立失敗,而且read返回的errno指明了連接失敗的原因.如果連接建立成功,read應該返回0;
3.再調用一次connect.它應該失敗,如果錯誤errno是EISCONN,就表示套接口已經建立,而且第一次連接是成功的;否則,連接就是失敗的;
對於無連接的socket類型(SOCK_DGRAM),客戶端也可以調用connect進行連接,此連接實際上並不建立類似SOCK_STREAM的連接,而僅僅是在本地保存了對端的地址,這樣后續的讀寫操作可以默認以連接的對端為操作對象。
當對端機器crash或者網絡連接被斷開(比如路由器不工作,網線斷開等),此時發送數據給對端然后讀取本端socket會返回ETIMEDOUT或者EHOSTUNREACH 或者ENETUNREACH(后兩個是中間路由器判斷服務器主機不可達的情況)。
當對端機器crash之后又重新啟動,然后客戶端再向原來的連接發送數據,因為服務器端已經沒有原來的連接信息,此時服務器端回送RST給客戶端,此時客戶端讀本地端口返回ECONNRESET錯誤。
當服務器所在的進程正常或者異常關閉時,會對所有打開的文件描述符進行close,因此對於連接的socket描述符則會向對端發送FIN分節進行正常關閉流程。對端在收到FIN之后端口變得可讀,此時讀取端口會返回0表示到了文件結尾(對端不會再發送數據)。
當一端收到RST導致讀取socket返回ECONNRESET,此時如果再次調用write發送數據給對端則觸發SIGPIPE信號,信號默認終止進程,如果忽略此信號或者從SIGPIPE的信號處理程序返回則write出錯返回EPIPE。
可以看出只有當本地端口主動發送消息給對端才能檢測出連接異常中斷的情況,搭配select進行多路分離的時候,socket收到RST或者FIN時候,select返回可讀(心跳消息就是用於檢測連接的狀態)。也可以使用socket的KEEPLIVE選項,依賴socket本身偵測socket連接異常中斷的情況。
發送socket數據有以下方法:
調用ssize_t send(int sockfd, const void *buf, size_t nbytes, int flags);,只能用於建立好了連接的socket(面向連接的SOCK_STREAM或者調用了connect的SOCK_DGRAM)。flags取值如下:
MSG_DONTROUTE 對數據不進行路由
MSG_DONTWAIT 不等待數據發送完成
MSG_EOR 數據包結尾
MSG_OOB 帶外數據
注意send函數成功返回並不代表對端一定收到了發送的消息,另外對於數據報協議如果發送的數據大於一個數據報長度則發送失敗(errno設置為EMSGSIZE)。
linux 客戶端 Socket 非阻塞connect編程(正文)
linux 客戶端 Socket 非阻塞connect編程(正文)/*開發過程與源碼解析
開發測試環境:虛擬機CentOS,windows網絡調試助手
非阻塞模式有3種用途
1.三次握手同時做其他的處理。connect要花一個往返時間完成,從幾毫秒的局域網到幾百毫秒或幾秒的廣域網。這段時間可能有一些其他的處理要執行,比如數據准備,預處理等。
2.用這種技術建立多個連接。這在web瀏覽器中很普遍.
3.由於程序用select等待連接完成,可以設置一個select等待時間限制,從而縮短connect超時時間。多數實現中,connect的超時時間在75秒到幾分鍾之間。有時程序希望在等待一定時間內結束,使用非阻塞connect可以防止阻塞75秒,在多線程網絡編程中,尤其必要。 例如有一個通過建立線程與其他主機進行socket通信的應用程序,如果建立的線程使用阻塞connect與遠程通信,當有幾百個線程並發的時候,由於網絡延遲而全部阻塞,阻塞的線程不會釋放系統的資源,同一時刻阻塞線程超過一定數量時候,系統就不再允許建立新的線程(每個進程由於進程空間的原因能產生的線程有限),如果使用非阻塞的connect,連接失敗使用select等待很短時間,如果還沒有連接后,線程立刻結束釋放資源,防止大量線程阻塞而使程序崩潰。
目前connect非阻塞編程的普遍思路是:
在一個TCP套接口設置為非阻塞后,調用connect,connect會在系統提供的errno變量中返回一個EINRPOCESS錯誤,此時TCP的三路握手繼續進行。之后可以用select函數檢查這個連接是否建立成功。以下實驗基於unix網絡編程和網絡上給出的普遍示例,在經過大量測試之后,發現其中有很多方法,在linux中,並不適用。
我先給出了重要源碼的逐步分析,在最后給出完整的connect非阻塞源碼。
1.首先填寫套接字結構,包括遠程的ip,通信端口如下: */
struct sockaddr_in serv_addr;
serv_addr.sin_family=AF_INET;
serv_addr.sin_port=htons(9999);
serv_addr.sin_addr.s_addr = inet_addr("58.31.231.255"); //inet_addr轉換為網絡字節序
bzero(&(serv_addr.sin_zero),8);
// 2.建立socket套接字:
if ((sockfd = socket(AF_INET, SOCK_STREAM, 0)) == -1)
{
perror("socket creat error");
return 1;
}
// 3.將socket建立為非阻塞,此時socket被設置為非阻塞模式
flags = fcntl(sockfd,F_GETFL,0);//獲取建立的sockfd的當前狀態(非阻塞)
fcntl(sockfd,F_SETFL,flags|O_NONBLOCK);//將當前sockfd設置為非阻塞
/*4. 建立connect連接,此時socket設置為非阻塞,connect調用后,無論連接是否建立立即返回-1,同時將errno(包含errno.h就可以直接使用)設置為EINPROGRESS, 表示此時tcp三次握手仍舊進行,如果errno不是EINPROGRESS,則說明連接錯誤,程序結束。
當客戶端和服務器端在同一台主機上的時候,connect回馬上結束,並返回0;無需等待,所以使用goto函數跳過select等待函數,直接進入連接后的處理部分。*/
if ( ( n = connect( sockfd, ( struct sockaddr *)&serv_addr , sizeof(struct sockaddr)) ) < 0 )
{
if(errno != EINPROGRESS) return 1;
}
if(n==0)
{
printf("connect completed immediately");
goto done;
}
/* 5.設置等待時間,使用select函數等待正在后台連接的connect函數,這里需要說明的是使用select監聽socket描述符是否可讀或者可寫,如果只可寫,說明連接成功,可以進行下面的操作。如果描述符既可讀又可寫,分為兩種情況,第一種情況是socket連接出現錯誤(不要問為什么,這是系統規定的,可讀可寫時候有可能是connect連接成功后遠程主機斷開了連接close(socket)),第二種情況是connect連接成功,socket讀緩沖區得到了遠程主機發送的數據。需要通過connect連接后返回給errno的值來進行判定,或者通過調用 getsockopt(sockfd,SOL_SOCKET,SO_ERROR,&error,&len); 函數返回值來判斷是否發生錯誤,這里存在一個可移植性問題,在solaris中發生錯誤返回-1,但在其他系統中可能返回0.我首先按unix網絡編程的源碼進行實現。如下:*/
FD_ZERO(&rset);
FD_SET(sockfd,&rset);
wset = rset;
tval.tv_sec = 0;
tval.tv_usec = 300000;
int error;
socklen_t len;
if(( n = select(sockfd+1, &rset, &wset, NULL,&tval)) <= 0)
{
printf("time out connect error");
close(sockfd);
return -1;
}
If ( FD_ISSET(sockfd,&rset) || FD_ISSET(sockfd,&west) )
{
len = sizeof(error);
if( getsockopt(sockfd,SOL_SOCKET,SO_ERROR,&error,&len) <0)
return 1;
}
/* 這里我測試了一下,按照unix網絡編程的描述,當網絡發生錯誤的時候,getsockopt返回-1,return -1,程序結束。網絡正常時候返回0,程序繼續執行。
可是我在linux下,無論網絡是否發生錯誤,getsockopt始終返回0,不返回-1,說明linux與unix網絡編程還是有些細微的差別。就是說當socket描述符可讀可寫的時候,這段代碼不起作用。不能檢測出網絡是否出現故障。
我測試的方法是,當調用connect后,sleep(2)休眠2秒,借助這兩秒時間將網絡助手斷開連接,這時候select返回2,說明套接口可讀又可寫,應該是網絡連接的出錯情況。
此時,getsockopt返回0,不起作用。獲取errno的值,指示為EINPROGRESS,沒有返回unix網絡編程中說的ENOTCONN,EINPROGRESS表示正在試圖連接,不能表示網絡已經連接失敗。
針對這種情況,unix網絡編程中提出了另外3種方法,這3種方法,也是網絡上給出的常用的非阻塞connect示例:
a.再調用connect一次。失敗返回errno是EISCONN說明連接成功,表示剛才的connect成功,否則返回失敗。 代碼如下:*/
int connect_ok;
connect(sockfd, (struct sockaddr *)&serv_addr, sizeof(struct sockaddr) );
switch (errno)
{
case EISCONN: //connect ok
printf("connect OK \n");
connect_ok = 1;
break;
case EALREADY:
connect_0k = -1
break;
case EINPROGRESS: // is connecting, need to check again
connect_ok = -1
break;
default:
printf("connect fail err=%d \n",errno);
connect_ok = -1;
break;
}
/*如程序所示,根據再次調用的errno返回值將connect_ok的值,來進行下面的處理,connect_ok為1繼續執行其他操作,否則程序結束。
但這種方法我在linux下測試了,當發生錯誤的時候,socket描述符(我的程序里是sockfd)變成可讀且可寫,但第二次調用connect 后,errno並沒有返回EISCONN,,也沒有返回連接失敗的錯誤,仍舊是EINPROGRESS,而當網絡不發生故障的時候,第二次使用 connect連接也返回EINPROGRESS,因此也無法通過再次connect來判斷連接是否成功。
b.unix網絡編程中說使用read函數,如果失敗,表示connect失敗,返回的errno指明了失敗原因,但這種方法在linux上行不通,linux在socket描述符為可讀可寫的時候,read返回0,並不會置errno為錯誤。
c.unix網絡編程中說使用getpeername函數,如果連接失敗,調用該函數后,通過errno來判斷第一次連接是否成功,但我試過了,無論網絡連接是否成功,errno都沒變化,都為EINPROGRESS,無法判斷。
悲哀啊,即使調用getpeername函數,getsockopt函數仍舊不行。
綜上方法,既然都不能確切知道非阻塞connect是否成功,所以我直接當描述符可讀可寫的情況下進行發送,通過能否獲取服務器的返回值來判斷是否成功。(如果服務器端的設計不發送數據,那就悲哀了。)
程序的書寫形式出於可移植性考慮,按照unix網絡編程推薦寫法,使用getsocketopt進行判斷,但不通過返回值來判斷,而通過函數的返回參數來判斷。
6. 用select查看接收描述符,如果可讀,就讀出數據,程序結束。在接收數據的時候注意要先對先前的rset重新賦值為描述符,因為select會對 rset清零,當調用select后,如果socket沒有變為可讀,則rset在select會被置零。所以如果在程序中使用了rset,最好在使用時候重新對rset賦值。
程序如下:*/
FD_ZERO(&rset);
FD_SET(sockfd,&rset);//如果前面select使用了rset,最好重新賦值
if( ( n = select(sockfd+1,&rset,NULL, NULL,&tval)) <= 0 )
{
close(sockfd);
return -1;
}
if ((recvbytes=recv(sockfd, buf, 1024, 0)) ==-1)
{
perror("recv error!");
close(sockfd);
return 1;
}
printf("receive num %d\n",recvbytes);
printf("%s\n",buf);
*/
非阻塞connect
在一個TCP套接口被設置為非阻塞之后調用connect,connect會立即返回EINPROGRESS錯誤,表示連接操作正在進行中,但是仍未完成;同時TCP的三路握手操作繼續進行;在這之后,我們可以調用select來檢查這個鏈接是否建立成功;非阻塞connect有三種用途:
1.我們可以在三路握手的同時做一些其它的處理.connect操作要花一個往返時間完成,而且可以是在任何地方,從幾個毫秒的局域網到幾百毫秒或幾秒的廣域網.在這段時間內我們可能有一些其他的處理想要執行;
2.可以用這種技術同時建立多個連接.在Web瀏覽器中很普遍;
3.由於我們使用select來等待連接的完成,因此我們可以給select設置一個時間限制,從而縮短connect的超時時間.在大多數實現中,connect的超時時間在75秒到幾分鍾之間.有時候應用程序想要一個更短的超時時間,使用非阻塞connect就是一種方法;
非阻塞connect聽起來雖然簡單,但是仍然有一些細節問題要處理:
1.即使套接口是非阻塞的,如果連接的服務器在同一台主機上,那么在調用connect建立連接時,連接通常會立即建立成功.我們必須處理這種情況;
2.源自Berkeley的實現(和Posix.1g)有兩條與select和非阻塞IO相關的規則:
A:當連接建立成功時,套接口描述符變成可寫;
B:當連接出錯時,套接口描述符變成既可讀又可寫;
注意:當一個套接口出錯時,它會被select調用標記為既可讀又可寫;
非阻塞connect有這么多好處,但是處理非阻塞connect時會遇到很多可移植性問題;
處理非阻塞connect的步驟:
第一步:創建socket,返回套接口描述符;
第二步:調用fcntl把套接口描述符設置成非阻塞;
第三步:調用connect開始建立連接;
第四步:判斷連接是否成功建立;
A:如果connect返回0,表示連接簡稱成功(服務器可客戶端在同一台機器上時就有可能發生這種情況);
B:調用select來等待連接建立成功完成;
如果select返回0,則表示建立連接超時;我們返回超時錯誤給用戶,同時關閉連接,以防止三路握手操作繼續進行下去;
如果select返回大於0的值,則需要檢查套接口描述符是否可讀或可寫;如果套接口描述符可讀或可寫,則我們可以通過調用getsockopt來得到套接口上待處理的錯誤(SO_ERROR),如果連接建立成功,這個錯誤值將是0,如果建立連接時遇到錯誤,則這個值是連接錯誤所對應的errno值(比如:ECONNREFUSED,ETIMEDOUT等).
"讀取套接口上的錯誤"是遇到的第一個可移植性問題;如果出現問題,getsockopt源自Berkeley的實現是返回0,等待處理的錯誤在變量errno中返回;但是Solaris會讓getsockopt返回-1,errno置為待處理的錯誤;我們對這兩種情況都要處理;
這樣,在處理非阻塞connect時,在不同的套接口實現的平台中存在的移植性問題,首先,有可能在調用select之前,連接就已經建立成功,而且對方的數據已經到來.在這種情況下,連接成功時套接口將既可讀又可寫.這和連接失敗時是一樣的.這個時候我們還得通過getsockopt來讀取錯誤值;這是第二個可移植性問題;
移植性問題總結:
1.對於出錯的套接口描述符,getsockopt的返回值源自Berkeley的實現是返回0,待處理的錯誤值存儲在errno中;而源自Solaris的實現是返回0,待處理的錯誤存儲在errno中;(套接口描述符出錯時調用getsockopt的返回值不可移植)
2.有可能在調用select之前,連接就已經建立成功,而且對方的數據已經到來,在這種情況下,套接口描述符是既可讀又可寫;這與套接口描述符出錯時是一樣的;(怎樣判斷連接是否建立成功的條件不可移植)
這樣的話,在我們判斷連接是否建立成功的條件不唯一時,我們可以有以下的方法來解決這個問題:
1.調用getpeername代替getsockopt.如果調用getpeername失敗,getpeername返回ENOTCONN,表示連接建立失敗,我們必須以SO_ERROR調用getsockopt得到套接口描述符上的待處理錯誤;
2.調用read,讀取長度為0字節的數據.如果read調用失敗,則表示連接建立失敗,而且read返回的errno指明了連接失敗的原因.如果連接建立成功,read應該返回0;
3.再調用一次connect.它應該失敗,如果錯誤errno是EISCONN,就表示套接口已經建立,而且第一次連接是成功的;否則,連接就是失敗的;
被中斷的connect:
如果在一個阻塞式套接口上調用connect,在TCP的三路握手操作完成之前被中斷了,比如說,被捕獲的信號中斷,將會發生什么呢?假定connect不會自動重啟,它將返回EINTR.那么,這個時候,我們就不能再調用connect等待連接建立完成了,如果再次調用connect來等待連接建立完成的話,connect將會返回錯誤值EADDRINUSE.在這種情況下,應該做的是調用select,就像在非阻塞式connect中所做的一樣.然后,select在連接建立成功(使套接口描述符可寫)或連接建立失敗(使套接口描述符既可讀又可寫)時返回;
socket -> connect -> recv/send -> close
其中socket沒有什么可疑問的,主要是創建一個套接字用於與服務端交換數據,並且通常它會迅速返回,此時並沒有數據通過網卡發送出去,而緊隨其后的 connect函數則會產生網絡數據的發送,TCP的三次握手也正是在此時開始,connect會先發送一個SYN包給服務端,並從最初始的CLOSED 狀態進入到SYN_SENT狀態,在此狀態等待服務端的確認包,通常情況下這個確認包會很快到達,以致於我們根本無法使用netstat命令看到 SYN_SENT狀態的存在,不過我們可以做一個極端情況的模擬,讓客戶端去連接一個隨意指定服務器(如IP地址為88.88.88.88),因為該服務 器很明顯不會反饋給我們SYN包的確認包(SYN ACK),客戶端就會在一定時間內處於SYN_SENT狀態,並在預定的超時時間(比如3分鍾)之后從connect函數返回,connect調用一旦失 敗(沒能到達ESTABLISHED狀態)這個套接字便不可用,若要再次調用connect函數則必須要重新使用socket函數創建新的套接字。
下面結合實例分析,客戶端代碼如下:
- /**
- * client.c
- *
- * TCP client program, it is a simple example only.
- * Writen By: Zhou Jianchun
- * Date: 2011.08.11
- *
- * Compiled With: gcc -o client client.c
- * Tested On: Ubuntu 11.04 LTS
- * gcc version: 4.5.2
- *
- */
- #include <stdio.h>
- #include <sys/socket.h>
- #include <unistd.h>
- #include <sys/types.h>
- #include <netinet/in.h>
- #include <stdlib.h>
- #include <string.h>
- #include <errno.h>
- #define SERVER_PORT 20000
- void usage(char *name)
- {
- printf("usage: %s IP\n", name);
- }
- int main(int argc, char **argv)
- {
- int server_fd, client_fd, length = 0;
- struct sockaddr_in server_addr, client_addr;
- socklen_t socklen = sizeof(server_addr);
- if(argc < 2)
- {
- usage(argv[0]);
- exit(1);
- }
- if((client_fd = socket(AF_INET, SOCK_STREAM, 0)) < 0)
- {
- printf("create socket error, exit!\n");
- exit(1);
- }
- srand(time(NULL));
- bzero(&client_addr, sizeof(client_addr));
- client_addr.sin_family = AF_INET;
- client_addr.sin_addr.s_addr = htons(INADDR_ANY);
- bzero(&server_addr, sizeof(server_addr));
- server_addr.sin_family = AF_INET;
- inet_aton(argv[1], &server_addr.sin_addr);
- server_addr.sin_port = htons(SERVER_PORT);
- if(connect(client_fd, (struct sockaddr*)&server_addr, socklen) < 0)
- {
- printf("can not connect to %s, exit!\n", argv[1]);
- printf("%s\n", strerror(errno));
- exit(1);
- }
- return 0;
- }
編譯完成之后執行:
- zhou@neptune:~/data/source$ ./client 88.88.88.88
此時程序會在connect函數中阻塞等待,約180秒之后輸出:
- can not connect to 88.88.88.88, exit!
- Connection timed out
此刻connect的返回值為ETIMEOUT。
在此過程中我們可以用netstat命令查詢連接狀態:
- zhou@neptune:~/data/source$ sudo netstat -natp |grep 20000
- tcp 0 1 192.168.0.4:44203 88.88.88.88:20000 SYN_SENT 5954/client
可以看到此時的TCP連接狀態為SYN_SENT,也就意味着發送了SYN包之后一直未得到服務端回饋SYN ACK包。
接下來我們使用這個客戶端程序來連接自己的機器,測試時我的IP地址是192.168.0.4,是一個無線局域網,結果如下:
- zhou@neptune:~/data/source$ ./client 192.168.0.4
- can not connect to 192.168.0.4, exit!
- Connection refused
因為我的機器上並沒有跑在指定端口(20000)上監聽的服務端程序,所以這個連接直接被協議棧拒絕(通過發送RST類型的TCP包),connect立刻返回,返回值為ECONNREFUSED。
再來看看去連接同一局域網中一台不存在的主機時的情形,比如這台想象的主機的IP地址為192.168.0.188:
- zhou@neptune:~/data/source$ ./client 192.168.0.188
- can not connect to 192.168.0.188, exit!
- No route to host
因為本地局域網中的該主機並不存在,ARP請求得不到回應,網關會回應主機不可達的ICMP報文,connect返回EHOSTUNREACH。
至此connect函數的分析就結束了,由於本人水平有限,博客中的不妥或錯誤之處在所難免,殷切希望讀者批評指正。同時也歡迎讀者共同探討相關的內容,如果樂意交流的話請留下您寶貴的意見,謝謝。
原來我們實現connect()超時基本上都使用unix網絡編程一書的非阻塞方式(connect_nonb),今天在網上看到一篇文章,覺得很有意思,轉載如下:
讀Linux內核源碼的時候偶然發現其connect的超時參數竟然和用SO_SNDTIMO操作的參數一致:
File: net/ipv4/af_inet.c
559 timeo = sock_sndtimeo(sk, flags & O_NONBLOCK); 560 561 if ((1 << sk->sk_state) & (TCPF_SYN_SENT | TCPF_SYN_RECV)) { 562 /* Error code is set above */ 563 if (!timeo || !inet_wait_for_connect(sk, timeo)) 564 goto out; 565 566 err = sock_intr_errno(timeo); 567 if (signal_pending(current)) 568 goto out; 569 } |
這意味着: 在Linux平台下,可以通過在connect之前設置SO_SNDTIMO來達到控制連接超時的目的。簡單的寫了份測試代碼:
#include <stdlib.h>
#include <stdio.h>
#include <sys/types.h>
#include <sys/socket.h>
#include <netinet/in.h>
#include <errno.h>
int main(int argc, char *argv[])
{
int fd;
struct sockaddr_in addr;
struct timeval timeo = {3, 0};
socklen_t len = sizeof(timeo);
fd = socket(AF_INET, SOCK_STREAM, 0);
if (argc == 4)
timeo.tv_sec = atoi(argv[3]);
setsockopt(fd, SOL_SOCKET, SO_SNDTIMEO, &timeo, len);
addr.sin_family = AF_INET;
addr.sin_addr.s_addr = inet_addr(argv[1]);
addr.sin_port = htons(atoi(argv[2]));
if (connect(fd, (struct sockaddr*)&addr, sizeof(addr)) == -1) {
if (errno == EINPROGRESS) {
fprintf(stderr, "timeout/n");
return -1;
}
perror("connect");
return 0;
}
printf("connected/n");
return 0;
}
socket -> connect -> recv/send -> close
其中socket沒有什么可疑問的,主要是創建一個套接字用於與服務端交換數據,並且通常它會迅速返回,此時並沒有數據通過網卡發送出去,而緊隨其后的 connect函數則會產生網絡數據的發送,TCP的三次握手也正是在此時開始,connect會先發送一個SYN包給服務端,並從最初始的CLOSED 狀態進入到SYN_SENT狀態,在此狀態等待服務端的確認包,通常情況下這個確認包會很快到達,以致於我們根本無法使用netstat命令看到 SYN_SENT狀態的存在,不過我們可以做一個極端情況的模擬,讓客戶端去連接一個隨意指定服務器(如IP地址為88.88.88.88),因為該服務 器很明顯不會反饋給我們SYN包的確認包(SYN ACK),客戶端就會在一定時間內處於SYN_SENT狀態,並在預定的超時時間(比如3分鍾)之后從connect函數返回,connect調用一旦失 敗(沒能到達ESTABLISHED狀態)這個套接字便不可用,若要再次調用connect函數則必須要重新使用socket函數創建新的套接字。
下面結合實例分析,客戶端代碼如下:
- /**
- * client.c
- *
- * TCP client program, it is a simple example only.
- * Writen By: Zhou Jianchun
- * Date: 2011.08.11
- *
- * Compiled With: gcc -o client client.c
- * Tested On: Ubuntu 11.04 LTS
- * gcc version: 4.5.2
- *
- */
- #include <stdio.h>
- #include <sys/socket.h>
- #include <unistd.h>
- #include <sys/types.h>
- #include <netinet/in.h>
- #include <stdlib.h>
- #include <string.h>
- #include <errno.h>
- #define SERVER_PORT 20000
- void usage(char *name)
- {
- printf("usage: %s IP\n", name);
- }
- int main(int argc, char **argv)
- {
- int server_fd, client_fd, length = 0;
- struct sockaddr_in server_addr, client_addr;
- socklen_t socklen = sizeof(server_addr);
- if(argc < 2)
- {
- usage(argv[0]);
- exit(1);
- }
- if((client_fd = socket(AF_INET, SOCK_STREAM, 0)) < 0)
- {
- printf("create socket error, exit!\n");
- exit(1);
- }
- srand(time(NULL));
- bzero(&client_addr, sizeof(client_addr));
- client_addr.sin_family = AF_INET;
- client_addr.sin_addr.s_addr = htons(INADDR_ANY);
- bzero(&server_addr, sizeof(server_addr));
- server_addr.sin_family = AF_INET;
- inet_aton(argv[1], &server_addr.sin_addr);
- server_addr.sin_port = htons(SERVER_PORT);
- if(connect(client_fd, (struct sockaddr*)&server_addr, socklen) < 0)
- {
- printf("can not connect to %s, exit!\n", argv[1]);
- printf("%s\n", strerror(errno));
- exit(1);
- }
- return 0;
- }
編譯完成之后執行:
- zhou@neptune:~/data/source$ ./client 88.88.88.88
此時程序會在connect函數中阻塞等待,約180秒之后輸出:
- can not connect to 88.88.88.88, exit!
- Connection timed out
此刻connect的返回值為ETIMEOUT。
在此過程中我們可以用netstat命令查詢連接狀態:
- zhou@neptune:~/data/source$ sudo netstat -natp |grep 20000
- tcp 0 1 192.168.0.4:44203 88.88.88.88:20000 SYN_SENT 5954/client
可以看到此時的TCP連接狀態為SYN_SENT,也就意味着發送了SYN包之后一直未得到服務端回饋SYN ACK包。
接下來我們使用這個客戶端程序來連接自己的機器,測試時我的IP地址是192.168.0.4,是一個無線局域網,結果如下:
- zhou@neptune:~/data/source$ ./client 192.168.0.4
- can not connect to 192.168.0.4, exit!
- Connection refused
因為我的機器上並沒有跑在指定端口(20000)上監聽的服務端程序,所以這個連接直接被協議棧拒絕(通過發送RST類型的TCP包),connect立刻返回,返回值為ECONNREFUSED。
再來看看去連接同一局域網中一台不存在的主機時的情形,比如這台想象的主機的IP地址為192.168.0.188:
- zhou@neptune:~/data/source$ ./client 192.168.0.188
- can not connect to 192.168.0.188, exit!
- No route to host
因為本地局域網中的該主機並不存在,ARP請求得不到回應,網關會回應主機不可達的ICMP報文,connect返回EHOSTUNREACH。
至此connect函數的分析就結束了,由於本人水平有限,博客中的不妥或錯誤之處在所難免,殷切希望讀者批評指正。同時也歡迎讀者共同探討相關的內容,如果樂意交流的話請留下您寶貴的意見,謝謝。
OK,閑話少扯,我們進入主題,下面結合一個簡單的TCP服務端與客戶端代碼,借助tcpdump命令來分析一下TCP建立連接時的三次握手過程(Three-way handshake process)。
服務端代碼如下:
- /**
- * server.c
- *
- * TCP server program, it is a simple example only.
- *
- * Writen By: Zhou Jianchun
- * Date: 2011.08.12
- *
- * Compiled With: gcc -o client client.c
- * Tested On: Ubuntu 11.04 LTS
- *
- * gcc version: 4.5.2
- *
- */
- #include <stdio.h>
- #include <sys/socket.h>
- #include <unistd.h>
- #include <sys/types.h>
- #include <netinet/in.h>
- #include <stdlib.h>
- #include <time.h>
- #include <strings.h>
- #include <string.h>
- #define SERVER_PORT 20000
- #define LENGTH_OF_LISTEN_QUEUE 10
- #define BUFFER_SIZE 255
- #define WELCOME_MESSAGE "welcome to our server."
- int main(int argc, char **argv)
- {
- int server_fd, client_fd;
- struct sockaddr_in server_addr, client_addr;
- if((server_fd = socket(AF_INET, SOCK_STREAM, 0)) < 0)
- {
- printf("create socket error, exit!\n");
- exit(1);
- }
- bzero(&server_addr, sizeof(server_addr));
- server_addr.sin_family = AF_INET;
- server_addr.sin_port = htons(SERVER_PORT);
- server_addr.sin_addr.s_addr = htons(INADDR_ANY);
- if(bind(server_fd, (struct sockaddr*)&server_addr, sizeof(server_addr)) < 0)
- {
- printf("bind to port %d failed, exit!\n", SERVER_PORT);
- exit(1);
- }
- if(listen(server_fd, LENGTH_OF_LISTEN_QUEUE) < 0)
- {
- printf("failed to listen, exit!\n");
- exit(1);
- }
- while(1)
- {
- char buf[BUFFER_SIZE];
- long timestamp;
- socklen_t length = sizeof(client_addr);
- client_fd = accept(server_fd, (struct sockaddr*)&client_addr, &length);
- if(client_fd <0)
- {
- printf("call accept error, break from while loop!\n");
- break;
- }
- strcpy(buf, WELCOME_MESSAGE);
- printf("connect from client: IP: %s, Port: %d\n", (char *)inet_ntoa(client_addr.sin_addr), ntohs(client_addr.sin_port));
- timestamp = time(NULL);
- strcat(buf, "timestamp on server:");
- strcat(buf, ctime(×tamp));
- send(client_fd, buf, BUFFER_SIZE, 0);
- close(client_fd);
- close(server_fd);
- return 0;
- }
- }
客戶端代碼:
- /**
- * client.c
- *
- * TCP client program, it is a simple example only.
- *
- * Writen By: Zhou Jianchun
- * Date: 2011.08.12
- *
- * Compiled With: gcc -o client client.c
- * Tested On: Ubuntu 11.04 LTS
- *
- * gcc version: 4.5.2
- *
- */
- #include <stdio.h>
- #include <sys/socket.h>
- #include <unistd.h>
- #include <sys/types.h>
- #include <netinet/in.h>
- #include <stdlib.h>
- #include <string.h>
- #define SERVER_PORT 20000
- #define CLIENT_PORT ((20001 + rand()) % 65536)
- #define BUFFER_SIZE 255
- #define REQUEST_MESSAGE "welcome to connect the server.\n"
- void usage(char *name)
- {
- printf("usage: %s IP\n", name);
- }
- int main(int argc, char **argv)
- {
- int server_fd, client_fd, length = 0;
- struct sockaddr_in server_addr, client_addr;
- socklen_t socklen = sizeof(server_addr);
- char buf[BUFFER_SIZE];
- if(argc < 2)
- {
- usage(argv[0]);
- exit(1);
- }
- if((client_fd = socket(AF_INET, SOCK_STREAM, 0)) < 0)
- {
- printf("create socket error, exit!\n");
- exit(1);
- }
- srand(time(NULL));
- bzero(&client_addr, sizeof(client_addr));
- client_addr.sin_family = AF_INET;
- //client_addr.sin_port = htons(CLIENT_PORT);
- client_addr.sin_port = htons(40000);
- client_addr.sin_addr.s_addr = htons(INADDR_ANY);
- bzero(&server_addr, sizeof(server_addr));
- server_addr.sin_family = AF_INET;
- inet_aton(argv[1], &server_addr.sin_addr);
- server_addr.sin_port = htons(SERVER_PORT);
- /*if(bind(client_fd, (struct sockaddr*)&client_addr, sizeof(client_addr)) < 0)
- {
- printf("bind to port %d failed, exit!\n", CLIENT_PORT);
- exit(1);
- }*/
- if(connect(client_fd, (struct sockaddr*)&server_addr, socklen) < 0)
- {
- printf("can not connect to %s, exit!\n", argv[1]);
- exit(1);
- }
- /*length = recv(client_fd, buf, BUFFER_SIZE, 0);
- if(length < 0)
- {
- printf("recieve data from %s error, exit!\n", argv[1]);
- exit(1);
- }
- */
- char *tmp = buf;
- while((length = read(client_fd, tmp, BUFFER_SIZE)) > 0)
- {
- tmp += length;
- }
- printf("frome server %s:\n\t%s", argv[1], buf);
- close(client_fd);
- return 0;
- }
代碼邏輯十分簡單,服務端程序啟動后監聽在20000端口,等待外部連接,客戶端啟動后連接過來,服務端發送一串字符串信息給客戶端,然后退出,客戶端在讀取完信息后也退出。
運行程序之前先在另一個終端下輸入如下命令:
tcpdump 'port 20000' -i lo -S
待兩端程序退出后可以看到該命令輸出如下信息:
- 17:05:35.358403 IP neptune.local.49493 > neptune.local.20000: Flags [S], seq 1317094743, win 32792, options [mss 16396,sackOK,TS val 7083694 ecr 0,nop,wscale 6], length 0
- 17:05:35.358439 IP neptune.local.20000 > neptune.local.49493: Flags [S.], seq 1311370954, ack 1317094744, win 32768, options [mss 16396,sackOK,TS val 7083694 ecr 7083694,nop,wscale 6], length 0
- 17:05:35.358468 IP neptune.local.49493 > neptune.local.20000: Flags [.], ack 1311370955, win 513, options [nop,nop,TS val 7083694 ecr 7083694], length 0
- 17:05:35.358871 IP neptune.local.20000 > neptune.local.49493: Flags [P.], seq 1311370955:1311371210, ack 1317094744, win 512, options [nop,nop,TS val 7083694 ecr 7083694], length 255
- 17:05:35.358890 IP neptune.local.49493 > neptune.local.20000: Flags [.], ack 1311371210, win 530, options [nop,nop,TS val 7083694 ecr 7083694], length 0
- 17:05:35.358913 IP neptune.local.20000 > neptune.local.49493: Flags [F.], seq 1311371210, ack 1317094744, win 512, options [nop,nop,TS val 7083694 ecr 7083694], length 0
- 17:05:35.359419 IP neptune.local.49493 > neptune.local.20000: Flags [F.], seq 1317094744, ack 1311371211, win 530, options [nop,nop,TS val 7083694 ecr 7083694], length 0
- 17:05:35.359441 IP neptune.local.20000 > neptune.local.49493: Flags [.], ack 1317094745, win 512, options [nop,nop,TS val 7083694 ecr 7083694], length 0
下面我們逐條進行分析:
1.客戶端通過49493端口向服務端的20000端口發送一個SYN同步請求包,展開第一次握手,其中Flags [S]表求數據包的類型為SYN, 即同步請求包,seq字段標識數據包序列號。
2.服務端發送ACK確認包,同時附代一個SYN請求包,在確認客戶端同步請求的同時 向客戶端發送同步請求,其中Flags [S.]中的點號表示這是個確認包(ACK),S表示它同時又是一個SYN請求包。因為TCP是雙工通信協議,連接建立之后雙方可以同時收發數據,所以雙 方都發送了SYN包請求同步。
3.客戶端發送ACK包確認服務端的SYN同步請求,可以看到此時Flags中只有一個小數點,表示這個包只是用來做確認的。
到此為止,三次握手過程就結束了,雙方如果都收到了ACK包,則都進入到ESTABLISHED狀態,表明此時可以進行數據發送了。
4.服務端向客戶端發送一個數據包,包中的內容就是一個字符串,可以看到此時的Flags標識中有個字母P,意為PUSH DATA,就是發送數據的意思。
至此TCP三次握手過程的分析就結束了,由於本人水平有限,博客中的不妥或錯誤之處在所難免,殷切希望讀者批評指正。同時也歡迎讀者共同探討相關的內容,如果樂意交流的話請留下您寶貴的意見,謝謝。
(1)客戶端發送一個帶SYN標志的TCP報文到服務器。這是三次握手過程中的報文1。
(2) 服務器端回應客戶端的,這是三次握手中的第2個報文,這個報文同時帶ACK標志和SYN標志。因此它表示對剛才客戶端SYN報文的回應;同時又標志SYN給客戶端,詢問客戶端是否准備好進行數據通訊。
(3) 客戶必須再次回應服務段一個ACK報文,這是報文段3。
2、連接終止協議(四次握手)
由於TCP連接是全雙工的,因此每個方向都必須單獨進行關閉。這原則是當一方完成它的數據發送任務后就能發送一個FIN來終止這個方向的連接。收到一個 FIN只意味着這一方向上沒有數據流動,一個TCP連接在收到一個FIN后仍能發送數據。首先進行關閉的一方將執行主動關閉,而另一方執行被動關閉。
(1) TCP客戶端發送一個FIN,用來關閉客戶到服務器的數據傳送(報文段4)。
(2) 服務器收到這個FIN,它發回一個ACK,確認序號為收到的序號加1(報文段5)。和SYN一樣,一個FIN將占用一個序號。
(3) 服務器關閉客戶端的連接,發送一個FIN給客戶端(報文段6)。
(4) 客戶段發回ACK報文確認,並將確認序號設置為收到序號加1(報文段7)。
CLOSED: 這個沒什么好說的了,表示初始狀態。
LISTEN: 這個也是非常容易理解的一個狀態,表示服務器端的某個SOCKET處於監聽狀態,可以接受連接了。
SYN_RCVD: 這個狀態表示接受到了SYN報文,在正常情況下,這個狀態是服務器端的SOCKET在建立TCP連接時的三次握手會話過程中的一個中間狀態,很短暫,基本上用netstat你是很難看到這種狀態的,除非你特意寫了一個客戶端測試程序,故意將三次TCP握手過程中最后一個ACK報文不予發送。因此這種狀態時,當收到客戶端的ACK報文后,它會進入到ESTABLISHED狀態。
SYN_SENT: 這個狀態與SYN_RCVD遙想呼應,當客戶端SOCKET執行CONNECT連接時,它首先發送SYN報文,因此也隨即它會進入到了SYN_SENT狀態,並等待服務端的發送三次握手中的第2個報文。SYN_SENT狀態表示客戶端已發送SYN報文。
ESTABLISHED:這個容易理解了,表示連接已經建立了。
FIN_WAIT_1: 這個狀態要好好解釋一下,其實FIN_WAIT_1和FIN_WAIT_2狀態的真正含義都是表示等待對方的FIN報文。而這兩種狀態的區別是:FIN_WAIT_1狀態實際上是當SOCKET在ESTABLISHED狀態時,它想主動關閉連接,向對方發送了FIN報文,此時該SOCKET即進入到FIN_WAIT_1狀態。而當對方回應ACK報文后,則進入到FIN_WAIT_2狀態,當然在實際的正常情況下,無論對方何種情況下,都應該馬上回應ACK報文,所以FIN_WAIT_1狀態一般是比較難見到的,而FIN_WAIT_2狀態還有時常常可以用netstat看到。
FIN_WAIT_2:上面已經詳細解釋了這種狀態,實際上FIN_WAIT_2狀態下的SOCKET,表示半連接,也即有一方要求close連接,但另外還告訴對方,我暫時還有點數據需要傳送給你,稍后再關閉連接。
TIME_WAIT: 表示收到了對方的FIN報文,並發送出了ACK報文,就等2MSL后即可回到CLOSED可用狀態了。如果FIN_WAIT_1狀態下,收到了對方同時帶FIN標志和ACK標志的報文時,可以直接進入到TIME_WAIT狀態,而無須經過FIN_WAIT_2狀態。
CLOSING: 這種狀態比較特殊,實際情況中應該是很少見,屬於一種比較罕見的例外狀態。正常情況下,當你發送FIN報文后,按理來說是應該先收到(或同時收到)對方的ACK報文,再收到對方的FIN報文。但是CLOSING狀態表示你發送FIN報文后,並沒有收到對方的ACK報文,反而卻也收到了對方的FIN報文。什么情況下會出現此種情況呢?其實細想一下,也不難得出結論:那就是如果雙方幾乎在同時close一個SOCKET的話,那么就出現了雙方同時發送FIN報文的情況,也即會出現CLOSING狀態,表示雙方都正在關閉SOCKET連接。
CLOSE_WAIT: 這種狀態的含義其實是表示在等待關閉。怎么理解呢?當對方close一個SOCKET后發送FIN報文給自己,你系統毫無疑問地會回應一個ACK報文給對方,此時則進入到CLOSE_WAIT狀態。接下來呢,實際上你真正需要考慮的事情是察看你是否還有數據發送給對方,如果沒有的話,那么你也就可以close這個SOCKET,發送FIN報文給對方,也即關閉連接。所以你在CLOSE_WAIT狀態下,需要完成的事情是等待你去關閉連接。
LAST_ACK: 這個狀態還是比較容易好理解的,它是被動關閉一方在發送FIN報文后,最后等待對方的ACK報文。當收到ACK報文后,也即可以進入到CLOSED可用狀態了。
最后有2個問題的回答,我自己分析后的結論(不一定保證100%正確)
1、 為什么建立連接協議是三次握手,而關閉連接卻是四次握手呢?
這是因為服務端的LISTEN狀態下的SOCKET當收到SYN報文的建連請求后,它可以把ACK和SYN(ACK起應答作用,而SYN起同步作用)放在一個報文里來發送。但關閉連接時,當收到對方的FIN報文通知時,它僅僅表示對方沒有數據發送給你了;但未必你所有的數據都全部發送給對方了,所以你可以未必會馬上會關閉SOCKET,也即你可能還需要發送一些數據給對方之后,再發送FIN報文給對方來表示你同意現在可以關閉連接了,所以它這里的ACK報文和FIN報文多數情況下都是分開發送的。
2、 為什么TIME_WAIT狀態還需要等2MSL后才能返回到CLOSED狀態?
這是因為:雖然雙方都同意關閉連接了,而且握手的4個報文也都協調和發送完畢,按理可以直接回到CLOSED狀態(就好比從SYN_SEND狀態到ESTABLISH狀態那樣);但是因為我們必須要假想網絡是不可靠的,你無法保證你最后發送的ACK報文會一定被對方收到,因此對方處於LAST_ACK狀態下的SOCKET可能會因為超時未收到ACK報文,而重發FIN報文,所以這個TIME_WAIT狀態的作用就是用來重發可能丟失的ACK報文,並保證於此。