UDP TCP 消息邊界

本文轉載自查看原文 2015-07-01 15:25 2310 TCP/ C/C++ 面試/ 計算機系統

先明確一個問題，如果定義了一個數據結構，大小是，比方說 32 個字節，然后 UDP 客戶端連續向服務端發了兩個包。現在假設這兩個包都已經到達了服務器，那么服務端調用 recvfrom 來接收數據，並且緩沖區開得遠大於 64，例如，開了 1024 個字節，那么，服務端的 recvfrom 函數是會一次收到兩個數據包呢，還是只能收到一個。

答案是只能收到一個。

來看代碼：

struct.h

#ifndef STRUCT_H
#define STRUCT_H
 
typedef struct _UDP_MSG {
    int add1;
    int add2;
    int sum;
    char str1[16];
    char str2[16];
    char cat[32];
} UDP_MSG;
 
#endif /* STRUCT_H */

服務器的代碼：

#include <sys/types.h>
#include <sys/socket.h>
#include <string.h>
#include <unistd.h>
#include <netinet/in.h>
#include <stdio.h>
#include <stdlib.h>
 
#include "struct.h"
 
#define MAX_LINE 1024
#define SERV_PORT 8080
 
int udp_serv();
 
int main() {
    return udp_serv();
}
 
int udp_serv() {
    int sockfd = socket(AF_INET, SOCK_DGRAM, 0);
    if (sockfd == -1) {
        perror("socket");
        return -1;
    }
     
    struct sockaddr_in serv_addr;
    memset(&serv_addr, 0, sizeof(serv_addr));
    serv_addr.sin_family = AF_INET;
    serv_addr.sin_addr.s_addr = htonl(INADDR_ANY);
    serv_addr.sin_port = htons(SERV_PORT);
 
    if (bind(sockfd, (struct sockaddr*)&serv_addr, sizeof(serv_addr)) == -1) {
        perror("bind");
        return -1;
    }
 
    while (1) {
        printf("sleeping\n");
        sleep(10);
        printf("akwaked\n");
        char buf[BUFSIZ];
        struct sockaddr_in cli_addr;
        memset(&cli_addr, 0, sizeof(cli_addr));
        socklen_t cli_addr_len = sizeof(cli_addr);
        int recvn = recvfrom(sockfd, buf, sizeof(buf), 0, (struct sockaddr*)&cli_addr, &cli_addr_len);
        printf("recv %d bytes\n", recvn);
        UDP_MSG msg;
        memset(&msg, 0, sizeof(msg));
        printf("UDP_MSG size is %d\n", sizeof(msg));
        memcpy(&msg, buf, sizeof(msg));
        msg.sum = msg.add1 + msg.add2;
        strcpy(msg.cat, msg.str1);
        strcat(msg.cat, msg.str2);
        printf("msg.add1 is: %d\n", msg.add1);
        printf("msg.add2 is: %d\n", msg.add2);
        printf("msg.sum is: %d\n", msg.sum);
        printf("msg.str1 is: %s\n", msg.str1);
        printf("msg.str2 is: %s\n", msg.str2);
        printf("msg.cat is: %s\n", msg.cat);
        sendto(sockfd, &msg, sizeof(msg), 0, (struct sockaddr*)&cli_addr, cli_addr_len);
    }
 
    return 0;
}

客戶端的：

#include <sys/types.h>
#include <sys/socket.h>
#include <string.h>
#include <netinet/in.h>
#include <stdio.h>
#include <stdlib.h>
#include <arpa/inet.h>
#include <unistd.h>
 
#include "struct.h"
 
#define MAX_LINE 1024
#define SERV_PORT 8080
 
int udp_cli(const char* serv_ip);
 
int main(int argc, char* argv[]) {
    if (argc < 2) {
        printf("Usage: %s serv_ip\n", argv[0]);
        return 1;
    }
    return udp_cli(argv[1]);
}
 
int udp_cli(const char* serv_ip) {
    int sockfd = socket(AF_INET, SOCK_DGRAM, 0);
    if (sockfd == -1) {
        perror("socket");
        return -1;
    }
    struct sockaddr_in serv_addr;
    memset(&serv_addr, 0, sizeof(serv_addr));
    serv_addr.sin_family = AF_INET;
    serv_addr.sin_port = htons(SERV_PORT);
    if (inet_pton(AF_INET, serv_ip, &serv_addr.sin_addr) <= 0) {
        perror("inet_pton");
        return -1;
    }
    while (1) {
        UDP_MSG msg;
        memset(&msg, 0, sizeof(msg));
        msg.add1 = 1;
        msg.add2 = 2;
        scanf("%s%s", msg.str1, msg.str2);
        if (sendto(sockfd, &msg, sizeof(msg), 0,
            (struct sockaddr*)&serv_addr, sizeof(serv_addr)) == -1) {
            perror("write");
            return -1;
        } else {
            printf("send success\n");
        }
        if (sendto(sockfd, &msg, sizeof(msg), 0,
            (struct sockaddr*)&serv_addr, sizeof(serv_addr)) == -1) {
            perror("write2");
            return -1;
        } else {
            printf("send2 success\n");
        }
        socklen_t serv_addr_len = sizeof(serv_addr);
        if (recvfrom(sockfd, &msg, sizeof(msg), 0,
            (struct sockaddr*)&serv_addr, &serv_addr_len) == -1) {
            perror("read");
            return -1;
        }
        printf("msg.add1 is: %d\n", msg.add1);
        printf("msg.add2 is: %d\n", msg.add2);
        printf("msg.sum is: %d\n", msg.sum);
        printf("msg.str1 is: %s\n", msg.str1);
        printf("msg.str2 is: %s\n", msg.str2);
        printf("msg.cat is: %s\n", msg.cat);
        break;
    }
    return 0;
}

運行起來后，服務端的輸出如下：

sleeping
akwaked
recv 76 bytes
UDP_MSG size is 76
msg.add1 is: 1
msg.add2 is: 2
msg.sum is: 3
msg.str1 is: 123
msg.str2 is: 456
msg.cat is: 123456
sleeping
akwaked
recv 76 bytes
UDP_MSG size is 76
msg.add1 is: 1
msg.add2 is: 2
msg.sum is: 3
msg.str1 is: 123
msg.str2 is: 456
msg.cat is: 123456
sleeping

客戶端如下：

123
456
send success
send2 success
msg.add1 is: 1
msg.add2 is: 2
msg.sum is: 3
msg.str1 is: 123
msg.str2 is: 456
msg.cat is: 123456

這里涉及到一個邊界的問題。 TCP 是流式的數據傳輸，消息沒有邊界，需要應用層自己去定義消息邊界，而 UDP 是數據報傳輸，所以協議保證了一次只能接收一個數據報。

詳細的解釋看到這里，http://hi.baidu.com/chongerfeia/item/c38f91e075d742226dabb8a4

2010-08-11 14:56 有關TCP和UDP 粘包消息保護邊界在socket網絡程序中，TCP和UDP分別是面向連接和非面向連接的。因此TCP的socket編程，收發兩端（客戶端和服務器端）都要有一一成對的socket，因此，發送端為了將多個發往接收端的包，更有效的發到對方，使用了優化方法（Nagle算法），將多次間隔較小且數據量小的數據，合並成一個大的數據塊，然后進行封包。這樣，接收端，就難於分辨出來了，必須提供科學的拆包機制。
對於UDP，不會使用塊的合並優化算法，這樣，實際上目前認為，是由於UDP支持的是一對多的模式，所以接收端的skbuff(套接字緩沖區）采用了鏈式結構來記錄每一個到達的UDP包，在每個UDP包中就有了消息頭（消息來源地址，端口等信息），這樣，對於接收端來說，就容易進行區分處理了

保護消息邊界和流
那么什么是保護消息邊界和流呢?

保護消息邊界，就是指傳輸協議把數據當作一條獨立的消息在網上
傳輸,接收端只能接收獨立的消息.也就是說存在保護消息邊界,接收
端一次只能接收發送端發出的一個數據包.
而面向流則是指無保護消息保護邊界的,如果發送端連續發送數據,
接收端有可能在一次接收動作中,會接收兩個或者更多的數據包.

我們舉個例子來說,例如,我們連續發送三個數據包,大小分別是2k,
4k , 8k,這三個數據包,都已經到達了接收端的網絡堆棧中,如果使
用UDP協議,不管我們使用多大的接收緩沖區去接收數據,我們必須有
三次接收動作,才能夠把所有的數據包接收完.而使用TCP協議,我們
只要把接收的緩沖區大小設置在14k以上,我們就能夠一次把所有的
數據包接收下來.只需要有一次接收動作.

這就是因為UDP協議的保護消息邊界使得每一個消息都是獨立的.而
流傳輸,卻把數據當作一串數據流,他不認為數據是一個一個的消息.

所以有很多人在使用tcp協議通訊的時候,並不清楚tcp是基於流的
傳輸,當連續發送數據的時候,他們時常會認識tcp會丟包.其實不然,
因為當他們使用的緩沖區足夠大時,他們有可能會一次接收到兩個甚
至更多的數據包,而很多人往往會忽視這一點,只解析檢查了第一個
數據包,而已經接收的其他數據包卻被忽略了.所以大家如果要作這
類的網絡編程的時候,必須要注意這一點.

結論：
根據以上所說，可以這樣理解，TCP為了保證可靠傳輸，盡量減少額外
開銷（每次發包都要驗證），因此采用了流式傳輸，面向流的傳輸，
相對於面向消息的傳輸，可以減少發送包的數量。從而減少了額外開
銷。但是，對於數據傳輸頻繁的程序來講，使用TCP可能會容易粘包。
當然，對接收端的程序來講，如果機器負荷很重，也會在接收緩沖里
粘包。這樣，就需要接收端額外拆包，增加了工作量。因此，這個特
別適合的是數據要求可靠傳輸，但是不需要太頻繁傳輸的場合（
兩次操作間隔100ms，具體是由TCP等待發送間隔決定的，取決於內核
中的socket的寫法）

而UDP，由於面向的是消息傳輸，它把所有接收到的消息都掛接到緩沖
區的接受隊列中，因此，它對於數據的提取分離就更加方便，但是，
它沒有粘包機制，因此，當發送數據量較小的時候，就會發生數據包
有效載荷較小的情況，也會增加多次發送的系統發送開銷（系統調用，
寫硬件等）和接收開銷。因此，應該最好設置一個比較合適的數據包
的包長，來進行UDP數據的發送。（UDP最大載荷為1472，因此最好能
每次傳輸接近這個數的數據量，這特別適合於視頻，音頻等大塊數據
的發送，同時，通過減少握手來保證流媒體的實時性）

免責聲明！

本站轉載的文章為個人學習借鑒使用，本站對版權不負任何法律責任。如果侵犯了您的隱私權益，請聯系本站郵箱yoyou2525@163.com刪除。

猜您在找 有關TCP和UDP 粘包消息保護邊界基於tcp的應用層消息邊界如何定義 tcp和udp的網絡編程（發送消息及回復） Mina、Netty、Twisted一起學（二）：TCP消息邊界問題及按行分割消息 Socket編程 (連接,發送消息) (Tcp、Udp) - Part1 關於TCP/UDP通信長連接->消息隊列kafka+springboot TCP與UDP TCP與UDP tcp/udp的區別，udp可以模擬tcp TCP/IP——何時用UDP代替TCP