TCP與UDP區別
TCP---傳輸控制協議,提供的是面向連接、可靠的字節流服務。當客戶和服務器彼此交換數據前,必須先在雙方之間建立一個TCP連接,之后才能傳輸數據。TCP提供超時重發,丟棄重復數據,檢驗數據,流量控制等功能,保證數據能從一端傳到另一端。
UDP---用戶數據報協議,是一個簡單的面向數據報的運輸層協議。UDP不提供可靠性,它只是把應用程序傳給IP層的數據報發送出去,但是並不能保證它們能到達目的地。由於UDP在傳輸數據報前不用在客戶和服務器之間建立一個連接,且沒有超時重發等機制,故而傳輸速度很快
TCP和UDP都是在傳輸層上的。簡單來說,UDP發送 數據的時候是不管數據有沒有真正達到目的地的,所以傳輸起來速度就比較快了。但是同時也容易造成數據丟失。而TCP我們知道有三次握手建立,四次握手釋放,所以傳輸更准確,但是速度可能會相對慢一些。
為確保正確地接收數據,TCP要求在目標計算機成功收到數據時發回一個確認(即ACK)。如果在某個時限內未收到相應的ACK,將重新傳送數據包。如果網絡擁塞,這種重新傳送將導致發送的數據包重復。但是,接收計算機可使用數據包的序號來確定它是否為重復數據包,並在必要時丟棄它(這里讓我想起了linux IPC里可靠信號與不可靠信號的發送也是與之類似的)。
socket套接字
套接口可以說是網絡編程中一個非常重要的概念,linux以文件的形式實現套接口,與套接口相應的文件屬於sockfs特殊文件系統,創建一個套接口就是在sockfs中創建一個特殊文件,並建立起為實現套接口功能的相關數據結構。換句話說,對每一個新創建的BSD套接口,linux內核都將在sockfs特殊文件系統中創建一個新的inode。描述套接口的數據結構是socket,將在后面給出。
(一)重要數據結構
下面是在網絡編程中比較重要的幾個數據結構,讀者可以在后面介紹編程API部分再回過頭來了解它們。
套接口是由socket數據結構代表的,形式如下:
structsocket { socket_state state; /*指明套接口的連接狀態,一個套接口的連接狀態可以有以下幾種 套接口是空閑的,還沒有進行相應的端口及地址的綁定;還沒有連接;正在連接中;已經連接;正在解除連接。*/ unsignedlong flags; structproto_ops ops; /*指明可對套接口進行的各種操作*/ structinode inode; /*指向sockfs文件系統中的相應inode*/ structfasync_struct *fasync_list; /* Asynchronous wake up list */ structfile *file; /*指向sockfs文件系統中的相應文件 */ structsock sk; /*任何協議族都有其特定的套接口特性,該域就指向特定協議族的套接口對 象。*/ wait_queue_head_t wait; short type; unsignedchar passcred; }; |
(2)描述套接口通用地址的數據結構structsockaddr
由於歷史的緣故,在bind、connect等系統調用中,特定於協議的套接口地址結構指針都要強制轉換成該通用的套接口地址結構指針。結構形式如下:
structsockaddr { sa_family_t sa_family; /*address family, AF_xxx */ char sa_data[14]; /*14 bytes of protocol address */ }; |
(3)描述因特網地址結構的數據結構structsockaddr_in(這里局限於IP4):
structsockaddr_in { __SOCKADDR_COMMON(sin_); /*描述協議族*/ in_port_tsin_port; /*端口號*/ structin_addr sin_addr; /*因特網地址*/ /*Pad to size of `struct sockaddr'. */ unsignedchar sin_zero[sizeof (struct sockaddr) - __SOCKADDR_COMMON_SIZE - sizeof (in_port_t) - sizeof (struct in_addr)]; }; |
(二)基本的socket接口函數。
3.1、socket()函數
int socket(int domain, int type, int protocol);
socket函數對應於普通文件的打開操作。普通文件的打開操作返回一個文件描述字,而socket()用於創建一個socket描述符(socket descriptor),它唯一標識一個socket。這個socket描述字跟文件描述字一樣,后續的操作都有用到它,把它作為參數,通過它來進行一些讀寫操作。
正如可以給fopen的傳入不同參數值,以打開不同的文件。創建socket的時候,也可以指定不同的參數創建不同的socket描述符,socket函數的三個參數分別為:
- domain:即協議域,又稱為協議族(family)。常用的協議族有,AF_INET、AF_INET6、AF_LOCAL(或稱AF_UNIX,Unix域socket)、AF_ROUTE等等。協議族決定了socket的地址類型,在通信中必須采用對應的地址,如AF_INET決定了要用ipv4地址(32位的)與端口號(16位的)的組合、AF_UNIX決定了要用一個絕對路徑名作為地址。
- type:指定socket類型。常用的socket類型有,SOCK_STREAM、SOCK_DGRAM、SOCK_RAW、SOCK_PACKET、SOCK_SEQPACKET等等(socket的類型有哪些?)。
- protocol:故名思意,就是指定協議。常用的協議有,IPPROTO_TCP、IPPTOTO_UDP、IPPROTO_SCTP、IPPROTO_TIPC等,它們分別對應TCP傳輸協議、UDP傳輸協議、STCP傳輸協議、TIPC傳輸協議。
注意:並不是上面的type和protocol可以隨意組合的,如SOCK_STREAM不可以跟IPPROTO_UDP組合。當protocol為0時,會自動選擇type類型對應的默認協議。
當我們調用socket創建一個socket時,返回的socket描述字它存在於協議族(address family,AF_XXX)空間中,但沒有一個具體的地址。如果想要給它賦值一個地址,就必須調用bind()函數,否則就當調用connect()、listen()時系統會自動隨機分配一個端口。
3.2、bind()函數
正如上面所說bind()函數把一個地址族中的特定地址賦給socket。例如對應AF_INET、AF_INET6就是把一個ipv4或ipv6地址和端口號組合賦給socket。
int bind(int sockfd, const struct sockaddr *addr, socklen_t addrlen);
函數的三個參數分別為:
- sockfd:即socket描述字,它是通過socket()函數創建了,唯一標識一個socket。bind()函數就是將給這個描述字綁定一個名字。
- addr:一個const struct sockaddr *指針,指向要綁定給sockfd的協議地址。這個地址結構根據地址創建socket時的地址協議族的不同而不同,如ipv4對應的是:
struct sockaddr_in { sa_family_t sin_family; /* address family: AF_INET */ in_port_t sin_port; /* port in network byte order */ struct in_addr sin_addr; /* internet address */ }; /* Internet address. */ struct in_addr { uint32_t s_addr; /* address in network byte order */ };
struct sockaddr_in6 { sa_family_t sin6_family; /* AF_INET6 */ in_port_t sin6_port; /* port number */ uint32_t sin6_flowinfo; /* IPv6 flow information */ struct in6_addr sin6_addr; /* IPv6 address */ uint32_t sin6_scope_id; /* Scope ID (new in 2.4) */ }; struct in6_addr { unsigned char s6_addr[16]; /* IPv6 address */ };
#define UNIX_PATH_MAX 108 struct sockaddr_un { sa_family_t sun_family; /* AF_UNIX */ char sun_path[UNIX_PATH_MAX]; /* pathname */ };
- addrlen:對應的是地址的長度。
通常服務器在啟動的時候都會綁定一個眾所周知的地址(如ip地址+端口號),用於提供服務,客戶就可以通過它來接連服務器;而客戶端就不用指定,有系統自動分配一個端口號和自身的ip地址組合。這就是為什么通常服務器端在listen之前會調用bind(),而客戶端就不會調用,而是在connect()時由系統隨機生成一個。
網絡字節序與主機字節序
主機字節序就是我們平常說的大端和小端模式:不同的CPU有不同的字節序類型,這些字節序是指整數在內存中保存的順序,這個叫做主機序。引用標准的Big-Endian和Little-Endian的定義如下:
a) Little-Endian就是低位字節排放在內存的低地址端,高位字節排放在內存的高地址端。
b) Big-Endian就是高位字節排放在內存的低地址端,低位字節排放在內存的高地址端。
網絡字節序:4個字節的32 bit值以下面的次序傳輸:首先是0~7bit,其次8~15bit,然后16~23bit,最后是24~31bit。這種傳輸次序稱作大端字節序。由於TCP/IP首部中所有的二進制整數在網絡中傳輸時都要求以這種次序,因此它又稱作網絡字節序。字節序,顧名思義字節的順序,就是大於一個字節類型的數據在內存中的存放順序,一個字節的數據沒有順序的問題了。
所以:在將一個地址綁定到socket的時候,請先將主機字節序轉換成為網絡字節序,而不要假定主機字節序跟網絡字節序一樣使用的是Big-Endian。由於這個問題曾引發過血案!公司項目代碼中由於存在這個問題,導致了很多莫名其妙的問題,所以請謹記對主機字節序不要做任何假定,務必將其轉化為網絡字節序再賦給socket。
3.3、listen()、connect()函數
如果作為一個服務器,在調用socket()、bind()之后就會調用listen()來監聽這個socket,如果客戶端這時調用connect()發出連接請求,服務器端就會接收到這個請求。
int listen(int sockfd, int backlog);
int connect(int sockfd, const struct sockaddr *addr, socklen_t addrlen);
listen函數的第一個參數即為要監聽的socket描述字,第二個參數為相應socket可以排隊的最大連接個數。socket()函數創建的socket默認是一個主動類型的,listen函數將socket變為被動類型的,等待客戶的連接請求。
connect函數的第一個參數即為客戶端的socket描述字,第二參數為服務器的socket地址,第三個參數為socket地址的長度。客戶端通過調用connect函數來建立與TCP服務器的連接。
3.4、accept()函數
TCP服務器端依次調用socket()、bind()、listen()之后,就會監聽指定的socket地址了。TCP客戶端依次調用socket()、connect()之后就想TCP服務器發送了一個連接請求。TCP服務器監聽到這個請求之后,就會調用accept()函數取接收請求,這樣連接就建立好了。之后就可以開始網絡I/O操作了,即類同於普通文件的讀寫I/O操作。
int accept(int sockfd, struct sockaddr *addr, socklen_t *addrlen);
accept函數的第一個參數為服務器的socket描述字,第二個參數為指向struct sockaddr *的指針,用於返回客戶端的協議地址,第三個參數為協議地址的長度。如果accpet成功,那么其返回值是由內核自動生成的一個全新的描述字,代表與返回客戶的TCP連接。
注意:accept的第一個參數為服務器的socket描述字,是服務器開始調用socket()函數生成的,稱為監聽socket描述字;而accept函數返回的是已連接的socket描述字。一個服務器通常通常僅僅只創建一個監聽socket描述字,它在該服務器的生命周期內一直存在。內核為每個由服務器進程接受的客戶連接創建了一個已連接socket描述字,當服務器完成了對某個客戶的服務,相應的已連接socket描述字就被關閉。
3.5、read()、write()等函數
萬事具備只欠東風,至此服務器與客戶已經建立好連接了。可以調用網絡I/O進行讀寫操作了,即實現了網咯中不同進程之間的通信!網絡I/O操作有下面幾組:
- read()/write()
- recv()/send()
- readv()/writev()
- recvmsg()/sendmsg()
- recvfrom()/sendto()
我推薦使用recvmsg()/sendmsg()函數,這兩個函數是最通用的I/O函數,實際上可以把上面的其它函數都替換成這兩個函數。它們的聲明如下:
- #include <unistd.h>
- ssize_t read(int fd, void *buf, size_t count);
- ssize_t write(int fd, const void *buf, size_t count);
- #include <sys/types.h>
- #include <sys/socket.h>
- ssize_t send(int sockfd, const void *buf, size_t len, int flags);
- ssize_t recv(int sockfd, void *buf, size_t len, int flags);
- ssize_t sendto(int sockfd, const void *buf, size_t len, int flags,
- const struct sockaddr *dest_addr, socklen_t addrlen);
- ssize_t recvfrom(int sockfd, void *buf, size_t len, int flags,
- struct sockaddr *src_addr, socklen_t *addrlen);
- ssize_t sendmsg(int sockfd, const struct msghdr *msg, int flags);
- ssize_t recvmsg(int sockfd, struct msghdr *msg, int flags);
read函數是負責從fd中讀取內容.當讀成功時,read返回實際所讀的字節數,如果返回的值是0表示已經讀到文件的結束了,小於0表示出現了錯誤。如果錯誤為EINTR說明讀是由中斷引起的,如果是ECONNREST表示網絡連接出了問題。
write函數將buf中的nbytes字節內容寫入文件描述符fd.成功時返回寫的字節數。失敗時返回-1,並設置errno變量。 在網絡程序中,當我們向套接字文件描述符寫時有倆種可能。1)write的返回值大於0,表示寫了部分或者是全部的數據。2)返回的值小於0,此時出現了錯誤。我們要根據錯誤類型來處理。如果錯誤為EINTR表示在寫的時候出現了中斷錯誤。如果為EPIPE表示網絡連接出現了問題(對方已經關閉了連接)。
其它的我就不一一介紹這幾對I/O函數了,具體參見man文檔或者baidu、Google,下面的例子中將使用到send/recv。
3.6、close()函數
在服務器與客戶端建立連接之后,會進行一些讀寫操作,完成了讀寫操作就要關閉相應的socket描述字,好比操作完打開的文件要調用fclose關閉打開的文件。
#include <unistd.h>
int close(int fd);
close一個TCP socket的缺省行為時把該socket標記為以關閉,然后立即返回到調用進程。該描述字不能再由調用進程使用,也就是說不能再作為read或write的第一個參數。
注意:close操作只是使相應socket描述字的引用計數-1,只有當引用計數為0的時候,才會觸發TCP客戶端向服務器發送終止連接請求。
下面是TCP的一個例子,分別是服務器端(server.c)和客戶端(client.c)
server.c
- #include<stdio.h>
- #include<stdlib.h>
- #include<string.h>
- #include<errno.h>
- #include<sys/types.h>
- #include<sys/socket.h>
- #include<netinet/in.h>
- #define MAXLINE 4096
- int main(int argc, char** argv)
- {
- int listenfd, connfd;
- struct sockaddr_in servaddr;
- char buff[4096];
- int n;
- if( (listenfd = socket(AF_INET, SOCK_STREAM, 0)) == -1 ){
- printf("create socket error: %s(errno: %d)\n",strerror(errno),errno);
- exit(0);
- }
- memset(&servaddr, 0, sizeof(servaddr));
- //協議地址
- servaddr.sin_family = AF_INET;
- servaddr.sin_addr.s_addr = htonl(INADDR_ANY);
- servaddr.sin_port = htons(6666);//
- //bind把一個地址族中的特定地址賦給socket
- if( bind(listenfd, (struct sockaddr*)&servaddr, sizeof(servaddr)) == -1){
- printf("bind socket error: %s(errno: %d)\n",strerror(errno),errno);
- exit(0);
- }
- if( listen(listenfd, 10) == -1){
- //listen 監聽
- printf("listen socket error: %s(errno: %d)\n",strerror(errno),errno);
- exit(0);
- }
- printf("======waiting for client's request======\n");
- while(1){
- if( (connfd = accept(listenfd, (struct sockaddr*)NULL, NULL)) == -1){
- printf("accept socket error: %s(errno: %d)",strerror(errno),errno);
- continue;
- }
- n = recv(connfd, buff, MAXLINE, 0);
- buff[n] = '\0';
- printf("recv msg from client: %s\n", buff);
- close(connfd);
- }
- close(listenfd);
- }
client.c
- #include<stdio.h>
- #include<stdlib.h>
- #include<string.h>
- #include<errno.h>
- #include<sys/types.h>
- #include<sys/socket.h>
- #include<netinet/in.h>
- #define MAXLINE 4096
- int main(int argc, char** argv)
- {
- int sockfd, n;
- char recvline[4096], sendline[4096];
- struct sockaddr_in servaddr;
- if( argc != 2){
- printf("usage: ./client <ipaddress>\n");
- exit(0);
- }
- if( (sockfd = socket(AF_INET, SOCK_STREAM, 0)) < 0){
- // 創建套接字描述符給sockfd
- printf("create socket error: %s(errno: %d)\n", strerror(errno),errno);
- exit(0);
- }
- memset(&servaddr, 0, sizeof(servaddr));
- //結構體清零
- servaddr.sin_family = AF_INET;
- servaddr.sin_port = htons(6666);//端口號
- if( inet_pton(AF_INET, argv[1], &servaddr.sin_addr) <= 0){
- //Linux下IP地址轉換函數,可以在將IP地址在“點分十進制”和“整數”之間轉換
- printf("inet_pton error for %s\n",argv[1]);
- exit(0);
- }
- if( connect(sockfd, (struct sockaddr*)&servaddr, sizeof(servaddr)) < 0){
- //連接請求
- printf("connect error: %s(errno: %d)\n",strerror(errno),errno);
- }
- printf("send msg to server: \n");
- fgets(sendline, 4096, stdin);
- if( send(sockfd, sendline, strlen(sendline), 0) < 0)
- {
- printf("send msg error: %s(errno: %d)\n", strerror(errno), errno);
- exit(0);
- }
- close(sockfd);
- exit(0);
- }
我們可以用ifconfig命令來查看我們本機的ip地址
接下來看UDP的一個例子,分別是服務器端(server.c)和客戶端(client.c)
- #include <stdio.h>
- #include <stdlib.h>
- #include <string.h>
- #include <sys/socket.h>
- #include <netinet/in.h>
- #include <arpa/inet.h>
- #include <netdb.h>
- #include <errno.h>
- #include <sys/types.h>
- int port = 8888;
- int main()
- {
- int sockfd;
- int len;
- int z;
- char buf[255];
- struct sockaddr_in adr_inet;
- struct sockaddr_in adr_clnt;
- printf("等待客戶端...\n");
- //建立IP地址
- adr_inet.sin_family = AF_INET;
- adr_inet.sin_port = htons(port);
- adr_inet.sin_addr.s_addr = htonl(INADDR_ANY);
- bzero(&(adr_inet.sin_zero),8);
- len = sizeof(adr_clnt);
- //建立socket
- sockfd = socket(AF_INET, SOCK_DGRAM, 0);
- if (sockfd == -1)
- {
- perror("socket 出錯");
- exit(1);
- }
- //bind socket
- z = bind (sockfd, (struct sockaddr *) &adr_inet, sizeof (adr_inet));
- if (z == -1)
- {
- perror("bind出錯");
- exit(1);
- }
- while(1)
- {
- z = recvfrom(sockfd, buf, sizeof(buf), 0, (struct sockaddr *)&adr_clnt, &len);
- if (z < 0)
- {
- perror("recvfrom 出錯");
- exit(1);
- }
- buf[z] = 0;
- printf("接收:%s",buf);
- if (strncmp(buf, "stop", 4) == 0)
- {
- printf("結束..\n");
- break;
- }
- }
- close(sockfd);
- exit(0);
- }
client.c
- #include <stdio.h>
- #include <stdlib.h>
- #include <string.h>
- #include <sys/socket.h>
- #include <netinet/in.h>
- #include <arpa/inet.h>
- #include <netdb.h>
- #include <errno.h>
- #include <sys/types.h>
- int port = 8888;
- int main()
- {
- int sockfd;
- int i = 0;
- int z;
- char buf[80], str1[80];
- struct sockaddr_in adr_srvr;
- FILE *fp;
- printf("打開文件...\n");
- fp = fopen ("liu", "r");
- if (fp == NULL)
- {
- perror("打開文件失敗\n");
- exit(1);
- }
- printf("連接服務端...\n");
- adr_srvr.sin_family = AF_INET;
- adr_srvr.sin_port = htons(port);
- adr_srvr.sin_addr.s_addr = htonl(INADDR_ANY);
- bzero(&(adr_srvr.sin_zero), 8);
- sockfd = socket(AF_INET, SOCK_DGRAM, 0);
- if (sockfd == -1)
- {
- perror("socket 出錯");
- exit(1);
- }
- printf("發送文件.....\n");
- for (i=0; i<3; i++)
- {
- fgets(str1,80,fp);
- printf("%d:%s",i, str1);
- sprintf(buf, "%d:%s", i, str1);
- z = sendto (sockfd, buf, sizeof(buf), 0, (struct sockaddr *)&adr_srvr, sizeof(adr_srvr));
- if (z < 0)
- {
- perror("recvfrom 出錯");
- exit(1);
- }
- }
- printf("發送....\n");
- sprintf(buf, "stop\n");
- z = sendto (sockfd, buf, sizeof(buf), 0, (struct sockaddr *)&adr_srvr, sizeof(adr_srvr));
- if (z < 0)
- {
- perror("sendto 出錯");
- exit(1);
- }
- fclose(fp);
- close(sockfd);
- exit(0);
- }
這里簡單比較一下TCP和UDP在編程實現上的一些區別:
建立一個TCP連接需要三次握手,而斷開一個TCP則需要四個分節。當某個應用進程調用close(主動端)后(可以是服務器端,也可以是客戶
端),這一端的TCP發送一個FIN,表示數據發送完畢;另一端(被動端)發送一個確認,當被動端待處理的應用進程都處理完畢后,發送一個FIN到主動
端,並關閉套接口,主動端接收到這個FIN后再發送一個確認,到此為止這個TCP連接被斷開。
2、UDP套接口
UDP套接口是無
連接的、不可靠的數據報協議;既然他不可靠為什么還要用呢?其一:當應用程序使用廣播或多播是只能使用UDP協議;其二:由於
他是無連接的,所以速度快。因為UDP套接口是無連接的,如果一方的數據報丟失,那另一方將無限等待,解決辦法是設置一個超時。
在編寫UDP套接口程序時,有幾點要注意:建立套接口時socket函數的第二個參數應該是SOCK_DGRAM,說明是建立一個UDP套接 口;由於UDP是無連接的,所以服務器端並不需要listen或accept函數;當UDP套接口調用connect函數時,內核只記錄連接放的IP地址 和端口,並立即返回給調用進程,正因為這個特性,UDP服務器程序中並不使用fock函數,用單進程就能完成所有客戶的請求。
參考資料:
http://www.cnblogs.com/skynet/archive/2010/12/12/1903949.html(吳秦)
Linux軟件工程師實用教程
http://blog.sina.com.cn/s/blog_493309600100clrw.html
深刻理解Linux進程間通信(IPC)鄭彥興
crocodile's blog