探討socket引發SIGPIPE信號的問題


  我寫socket相關的程序也不是一天兩天了,在我的記憶中,只要處理好recv(或read)的返回值中<0,==0,>0三種情況,程序便不會有什么問題。但最近在看公司的源代碼時,發現代碼中直接將SIGPIPE設置為SIG_IGN。而且附上一段注釋:往一個已經關閉的socket寫入數據會觸發SIGPIPE。我心中頓時一驚,我以前從來沒這樣做過,雖然沒出問題,難道只是我運氣好?

  周末,決定驗證一下。

  首先,socket的讀事件中,返回0表示socket已關閉。如果已經關閉,再往里面寫東西肯定會出問題的,肯定不是這么低級的問題。那么有一種情況,即假如服務端的epoll在一次loop中檢測該socket正常,然后去處理其他邏輯。恰好這時客戶端這時關閉了socket。接着服務端要往socket寫數據。那么,這時是否會出現SIGPIPE呢?於是在網上隨便拷貝了幾份代碼來驗證(偷懶...)。

  服務端代碼

#include<stdio.h>  
#include<stdlib.h>  
#include<string.h>  
#include<sys/socket.h>  
#include<sys/types.h>  
#include<unistd.h>  
#include<netinet/in.h>  
#include <errno.h>    
#define PORT 6666  
int main(int argc,char **argv)  
{  
    int ser_sockfd,cli_sockfd;  
    int err,n;  
  
    struct sockaddr_in ser_addr;  
    struct sockaddr_in cli_addr;  
    char recvline[200];
    const char *sendline = "hello client";
      
    ser_sockfd=socket(AF_INET,SOCK_STREAM,0);  
    if(ser_sockfd==-1)  
    {  
        printf("socket error:%s\n",strerror(errno));  
        return -1;  
    }  
      
    bzero(&ser_addr,sizeof(ser_addr));  
    ser_addr.sin_family=AF_INET;  
    ser_addr.sin_addr.s_addr=htonl(INADDR_ANY);  
    ser_addr.sin_port=htons(PORT);  
    err=bind(ser_sockfd,(struct sockaddr *)&ser_addr,sizeof(ser_addr));  
    if(err==-1)  
    {  
        printf("bind error:%s\n",strerror(errno));  
        return -1;  
    }  
      
    err=listen(ser_sockfd,5);  
    if(err==-1)  
    {  
        printf("listen error\n");  
        return -1;  
    }  
      
    printf("listen the port:%d\n",PORT);  
      
    while(1)  
    {     
        socklen_t addlen=sizeof(struct sockaddr);  
        cli_sockfd=accept(ser_sockfd,(struct sockaddr *)&cli_addr,&addlen);  
        if(cli_sockfd==-1)  
        {  
            printf("accept error\n");  
        }  
        while(1)  
        {  
            printf("waiting for client...\n");  
            n=recv(cli_sockfd,recvline,1024,0);
            printf( "recv return %d\n",n ); 
            if(n==-1)  
            {  
                printf("recv error\n");  
            }  
            recvline[n]='\0';  
              
            printf("recv data is:%s\n",recvline);  
              
            int ret = send(cli_sockfd,sendline,strlen(sendline),0);  
            printf( "send return %d\n",ret );
        }  
        close(cli_sockfd);  
    }  
      
    close(ser_sockfd);  
      
    return 0;  
} 
View Code

  客戶端代碼

#include<stdio.h>  
#include<stdlib.h>  
#include<string.h>  
#include<sys/socket.h>  
#include<sys/types.h>  
#include<unistd.h>  
#include<netinet/in.h>
#include <arpa/inet.h>

#define PORT 6666  

int main(int argc,char **argv)  
{  
    int sockfd;  
    int err,n;  
    struct sockaddr_in addr_ser;  
    const char *sendline = "hello baby"; 
      
    sockfd=socket(AF_INET,SOCK_STREAM,0);  
    if(sockfd==-1)  
    {  
        printf("socket error\n");  
        return -1;  
    }  
      
    bzero(&addr_ser,sizeof(addr_ser));  
    addr_ser.sin_family=AF_INET;  
    inet_aton( "127.0.0.1",&addr_ser.sin_addr );
    addr_ser.sin_port=htons(PORT);  
    err=connect(sockfd,(struct sockaddr *)&addr_ser,sizeof(addr_ser));  
    if(err==-1)  
    {  
        printf("connect error\n");  
        return -1;  
    }  
      
    printf("connect with server...\n");  

    send(sockfd,sendline,strlen(sendline),0);
    
    close( sockfd );
      
    printf("already close...\n");  
 
    return 0;  
}
View Code

  這個測試很簡單,服務器打開端口監聽,客戶端連接上服務器后馬上發送數據,接着直接關閉socket並退出程序。服務器在收到消息后,斷點等待客戶端退出,然后往socket寫數據,看是否會出現SIGPIPE。

  服務器編譯為sock_s,客戶端編譯sock_c,先用gdb運行sock_s,下好斷點,然后運行sock_c。

Reading symbols from ./sock_s...done.
(gdb) b 68
Breakpoint 1 at 0x400b7b: file sock_s.cpp, line 68.
(gdb) r
Starting program: /home/xzc/code/test/sock_s 
listen the port:6666
waiting for client...
recv return 10
recv data is:hello baby

Breakpoint 1, main (argc=1, argv=0x7fffffffded8) at sock_s.cpp:68
68                int ret = send(cli_sockfd,sendline,strlen(sendline),0);  
(gdb) c
Continuing.
send return 12
waiting for client...
recv return 0
recv data is:

Breakpoint 1, main (argc=1, argv=0x7fffffffded8) at sock_s.cpp:68
68                int ret = send(cli_sockfd,sendline,strlen(sendline),0);  
(gdb) c
Continuing.

Program received signal SIGPIPE, Broken pipe.
0x00007ffff7b104fd in __libc_send (fd=4, buf=0x400c74, n=12, flags=-1)
    at ../sysdeps/unix/sysv/linux/x86_64/send.c:27
27    ../sysdeps/unix/sysv/linux/x86_64/send.c: 沒有那個文件或目錄.

由上面的調試結果可以看出,客戶端連接上后發了hello baby然后直接退出。這時服務器在發送數據之前斷點停下。我故意等了很久,確認客戶端已真正退出,再continue,可以看到,send函數沒有異常,返回了12,說明數據正常寫到了socket緩沖區。這時socket會再次收到recv,長度為0,表示socket關閉。我故意不處理,繼續send,這次gdb捕捉到了SIGPIPE。

  在recv返回0之前用netstat查看網絡狀態:

...
tcp        0      0 localhost:58651         localhost:6666          FIN_WAIT2  
tcp        0      0 localhost:6666          localhost:58651         CLOSE_WAIT
...

在recv返回0之后,雖然服務器依然沒有調用close,連接在網絡狀態已經查詢不到,說明已關閉。但如果在recv返回0之前,斷點很久,客戶端的socket已關閉,服務端則仍然是CLOSE_WAIT,結果依然如上。

  后來又用了epoll模型來測試,結果不變。

  因此,recv返回0則認為程序已經知道socket關閉,socket底層將會正常執行TCP的斷開流程,跟你是否調用close無關。是否調用close只是是否釋放文件描述符等資源。所以,處理好socket的斷開事件,則無需理會SIGPIPE.


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM