很多介紹網絡編程的書籍中會這樣介紹connect系統調用:將本機的一個指定的套接字連接到一個指定地址的服務器套接字上去。下面是connect系統調用的定義:
int connect(int sockfd, const struct sockaddr *serv_addr, socklen_t addrlen);
參數sockfd是本地機器上的一個套接字描述符,在內核的系統調用函數中該描述符會被轉換成與之綁定的一個struct socket結構,這是真正的一個socket,代表了網絡通訊中連接的一端。serv_addr和addrlen則是要連接的服務器的地址和地址長度。
於是乎,有了這樣的理解:connect將在本機和指定服務器間建立一個連接。但實際上,connect操作並不引發網絡設備傳送任何的數據到對端。它所 做的操作只是通過路由規則和路由表等一些信息,在struct socket結構中填入一些有關對端服務器的信息。這樣,以后向對端發送數據報時,就不需要每次進行路由查詢等操作以確定對端地址信息和本地發送接口,應 用程序也就不需要每次傳入對端地址信息(可以使用send而不使用sendto)。基於這樣的理解,我們就不難弄明白,為什么不只是tcp socket可以connect,udp, raw socket也可以通過connect進行連接。它們的本質其實沒有多大差別:把通過路由查詢得到的對端主機的地址信息緩存到套接字結構struct socket中。
udp和raw的connect操作其實是完全一致的,都使用了myip4_datagram_connect函數。
為方便起見,我們再以一個實際的例子來描述該函數所做的事情,我們在主機172.16.48.2上向主機172.16.48.1的端口16000發送一個 udp數據報,172.16.48.2上的udp端口由系統自動選擇(為32768)。下面是一個簡單的應用程序示例:
#include <sys/types.h>
#include <sys/socket.h>
#include <sys/ioctl.h>
#include "my_inet.h"
#include <stdio.h>
#include <errno.h>
#include <arpa/inet.h>
#include <unistd.h>
int main()
{
int i;
//代表服務器地址的結構。
struct sockaddr_in dest;
dest.sin_family = MY_PF_INET;
dest.sin_port = htons(16000);
dest.sin_addr.s_addr = 0x013010AC;//172.16.48.1的網絡字節序。
int fd = socket( MY_PF_INET, SOCK_DGRAM, MY_IPPROTO_UDP );
if( fd < 0 ){
perror("socket: ");
return -1;
}
//連接操作。
if( connect( fd, (struct sockaddr*)&dest, sizeof(dest) ) < 0 )
perror("connect: ");
//不必通過sendto每次傳入對端地址信息了。
int bwrite = send( fd, "abcdefg", 7, 0 );
if( bwrite == -1 ){
perror("send: ");
return -1;
}
printf("sendto: %d\n", bwrite);
close( fd );
return 0;
}
connect系統調用的執行流在到達myip4_datagram_connect函數之前,已經對本地端口號進行自動選擇,並把socket綁定到了 myudp_hash表中。到達myip4_datagram_connect函數之后,第一件事情是建立一個struct flowi:
struct flowi fl = { .oif = 0, //輸出設備接口未定。
.nl_u = { .ip4_u = { .daddr = 172.16.48.1 //目的地址。
.saddr = 0.0.0.0 //源地址未定。
.tos = 0 } }, //一般服務
.proto = MY_IPPROTO_UDP, //UDP協議
.uli_u = { .ports =
{ .sport = 32768, //自動選擇的第一個源端口
.dport = 16000 } } }; //目的端口
以該結構體為信息查詢路由表,結果肯定查到main表,確定saddr為172.16.48.2。並得到一個struct rtable結構作為路由查詢結果。
對於my_inet域的套接字,結構體struct socket有一個成員struct inet_sock sock代表網絡層的一個套接字,其成員rcv_saddr(含義尚不明確)和saddr被賦172.16.48.2,daddr, dport被賦於服務器的地址和端口號。而表示連接狀態的sk_state成員被賦於TCP_ESTABLISHED,這里需要注意的是 TCP_ESTABLISHED並不專指TCP連接建立狀態,所有執行connect成功的套接字,其狀態都是TCP_ESTABLISHED。id被賦 於當前時間。成員sk_dst_cache指向路由查詢結果rtable的成員u.dst。從而套接字完全緩存路由查詢的結果。
執行了connect后的socket,需要發送數據報時,關於對端的信息全部可以從socket本身得到。但需要重申的一點是:由於路由緩存的存在,在連接的socket上發送數據報並不會比在未連接的socket上發送數據報效率高多少。