epoll是Linux內核為處理大批量句柄而作了改進的poll,是Linux下多路復用IO接口select/poll的增強版本,它能顯著減少程序在大量並發連接中只有少量活躍的情況下的系統CPU利用率。
一、epoll的優點
支持一個進程打開大數目的socket描述符。
IO效率不隨FD數目增加而線性下降。
內核微調。
二、epoll的使用
epoll有2種工作方式:LT和ET。
LT(level triggered,水平觸發)是缺省的工作方式,並且同時支持block和no-block socket.在這種做法中,內核告訴你一個文件描述符是否就緒了,然后你可以對這個就緒的fd進行IO操作。如果你不作任何操作,內核還是會繼續通知你的,所以,這種模式編程出錯誤可能性要小一點。傳統的select/poll都是這種模型的代表。
ET (edge-triggered,邊緣觸發)是高速工作方式,只支持no-block socket。在這種模式下,當描述符從未就緒變為就緒時,內核通過epoll告訴你。然后它會假設你知道文件描述符已經就緒,並且不會再為那個文件描述符發送更多的就緒通知,直到你做了某些操作導致那個文件描述符不再為就緒狀態了(比如,你在發送,接收或者接收請求,或者發送接收的數據少於一定量時導致了一個EWOULDBLOCK 錯誤)。但是請注意,如果一直不對這個fd作IO操作(從而導致它再次變成未就緒),內核不會發送更多的通知(only once)。
epoll相關的系統調用有3個:epoll_create, epoll_ctl和epoll_wait。在頭文件<sys/epoll.h>
1. int epoll_create(int size);
參數size:用來告訴內核要監聽的數目一共有多少個。
返回值:成功時,返回一個非負整數的文件描述符,作為創建好的epoll句柄。調用失敗時,返回-1,錯誤信息可以通過errno獲得。
說明:創建一個epoll句柄,size用來告訴內核這個監聽的數目一共有多大。這個參數不同於select()中的第一個參數,給出最大監聽的fd+1的值。需要注意的是,當創建好epoll句柄后,它就是會占用一個fd值,所以在使用完epoll后,必須調用close()關閉,否則可能導致fd被耗盡。
2. int epoll_ctl(int epfd, int op, int fd, struct epoll_event *event);
參數epfd:epoll_create()函數返回的epoll句柄。
參數op:操作選項。
參數fd:要進行操作的目標文件描述符。
參數event:struct epoll_event結構指針,將fd和要進行的操作關聯起來。
返回值:成功時,返回0,作為創建好的epoll句柄。調用失敗時,返回-1,錯誤信息可以通過errno獲得。
說明:epoll的事件注冊函數,它不同與select()是在監聽事件時告訴內核要監聽什么類型的事件,而是在這里先注冊要監聽的事件類型。
參數op的可選值有以下3個:
EPOLL_CTL_ADD:注冊新的fd到epfd中;
EPOLL_CTL_MOD:修改已經注冊的fd的監聽事件;
EPOLL_CTL_DEL:從epfd中刪除一個fd;
struct epoll_event結構如下:
- typedef union epoll_data {
- void *ptr;
- int fd;
- __uint32_t u32;
- __uint64_t u64;
- } epoll_data_t;
- struct epoll_event {
- __uint32_t events; /* Epoll events */
- epoll_data_t data; /* User data variable */
- };
events可以是以下幾個宏的集合:
EPOLLIN :表示對應的文件描述符可以讀(包括對端SOCKET正常關閉);
EPOLLOUT:表示對應的文件描述符可以寫;
EPOLLPRI:表示對應的文件描述符有緊急的數據可讀(這里應該表示有帶外數據到來);
EPOLLERR:表示對應的文件描述符發生錯誤;
EPOLLHUP:表示對應的文件描述符被掛斷;
EPOLLET: 將EPOLL設為邊緣觸發(Edge Triggered)模式,這是相對於水平觸發(Level Triggered)來說的。
EPOLLONESHOT:只監聽一次事件,當監聽完這次事件之后,如果還需要繼續監聽這個socket的話,需要再次把這個socket加入到EPOLL隊列里
3. int epoll_wait(int epfd, struct epoll_event * events, int maxevents, int timeout);
參數epfd:epoll_create()函數返回的epoll句柄。
參數events:struct epoll_event結構指針,用來從內核得到事件的集合。
參數 maxevents:告訴內核這個events有多大
參數 timeout: 等待時的超時時間,以毫秒為單位。
返回值:成功時,返回需要處理的事件數目。調用失敗時,返回0,表示等待超時。
說明:等待事件的產生。
三、示例
- /*
- 使用 epoll 寫的回射服務器
- 將從client中接收到的數據再返回給client
- */
- #include <iostream>
- #include <sys/socket.h>
- #include <sys/epoll.h>
- #include <netinet/in.h>
- #include <arpa/inet.h>
- #include <fcntl.h>
- #include <unistd.h>
- #include <stdio.h>
- #include <errno.h>
- using namespace std;
- #define MAXLINE 100
- #define OPEN_MAX 100
- #define LISTENQ 20
- #define SERV_PORT 5000
- #define INFTIM 1000
- void setnonblocking(int sock)
- {
- int opts;
- opts=fcntl(sock,F_GETFL);
- if(opts<0)
- {
- perror("fcntl(sock,GETFL)");
- exit(1);
- }
- opts = opts|O_NONBLOCK;
- if(fcntl(sock,F_SETFL,opts)<0)
- {
- perror("fcntl(sock,SETFL,opts)");
- exit(1);
- }
- }
- int main(int argc, char* argv[])
- {
- int i, maxi, listenfd, connfd, sockfd,epfd,nfds, portnumber;
- ssize_t n;
- char line[MAXLINE];
- socklen_t clilen;
- string szTemp("");
- if ( 2 == argc )
- {
- if( (portnumber = atoi(argv[1])) < 0 )
- {
- fprintf(stderr,"Usage:%s portnumber\a\n",argv[0]);
- return 1;
- }
- }
- else
- {
- fprintf(stderr,"Usage:%s portnumber\a\n",argv[0]);
- return 1;
- }
- //聲明epoll_event結構體的變量,ev用於注冊事件,數組用於回傳要處理的事件
- struct epoll_event ev, events[20];
- //創建一個epoll的句柄,size用來告訴內核這個監聽的數目一共有多大
- epfd = epoll_create(256); //生成用於處理accept的epoll專用的文件描述符
- struct sockaddr_in clientaddr;
- struct sockaddr_in serveraddr;
- listenfd = socket(AF_INET, SOCK_STREAM, 0);
- //把socket設置為非阻塞方式
- //setnonblocking(listenfd);
- //設置與要處理的事件相關的文件描述符
- ev.data.fd=listenfd;
- //設置要處理的事件類型
- ev.events=EPOLLIN|EPOLLET;
- //注冊epoll事件
- epoll_ctl(epfd,EPOLL_CTL_ADD,listenfd,&ev);
- bzero(&serveraddr, sizeof(serveraddr)); /*配置Server socket的相關信息 */
- serveraddr.sin_family = AF_INET;
- char *local_addr="127.0.0.1";
- inet_aton(local_addr,&(serveraddr.sin_addr));//htons(portnumber);
- serveraddr.sin_port=htons(portnumber);
- bind(listenfd,(sockaddr *)&serveraddr, sizeof(serveraddr));
- listen(listenfd, LISTENQ);
- maxi = 0;
- for ( ; ; ) {
- //等待epoll事件的發生
- //返回需要處理的事件數目nfds,如返回0表示已超時。
- nfds=epoll_wait(epfd,events,20,500);
- //處理所發生的所有事件
- for(i=0; i < nfds; ++i)
- {
- //如果新監測到一個SOCKET用戶連接到了綁定的SOCKET端口,建立新的連接。
- if(events[i].data.fd == listenfd)
- {
- connfd = accept(listenfd,(sockaddr *)&clientaddr, &clilen);
- if(connfd < 0)
- {
- perror("connfd < 0");
- exit(1);
- }
- //setnonblocking(connfd);
- char *str = inet_ntoa(clientaddr.sin_addr);
- cout << "accapt a connection from " << str << endl;
- //設置用於讀操作的文件描述符
- ev.data.fd=connfd;
- //設置用於注冊的讀操作事件
- ev.events=EPOLLIN|EPOLLET;
- //注冊ev
- epoll_ctl(epfd,EPOLL_CTL_ADD,connfd,&ev); /* 添加 */
- }
- //如果是已經連接的用戶,並且收到數據,那么進行讀入。
- else if(events[i].events&EPOLLIN)
- {
- cout << "EPOLLIN" << endl;
- if ( (sockfd = events[i].data.fd) < 0)
- continue;
- if ( (n = recv(sockfd, line, sizeof(line), 0)) < 0)
- {
- // Connection Reset:你連接的那一端已經斷開了,而你卻還試着在對方已斷開的socketfd上讀寫數據!
- if (errno == ECONNRESET)
- {
- close(sockfd);
- events[i].data.fd = -1;
- }
- else
- std::cout<<"readline error"<<std::endl;
- }
- else if (n == 0) //讀入的數據為空
- {
- close(sockfd);
- events[i].data.fd = -1;
- }
- szTemp = "";
- szTemp += line;
- szTemp = szTemp.substr(0,szTemp.find('\r')); /* remove the enter key */
- memset(line,0,100); /* clear the buffer */
- //line[n] = '\0';
- cout << "Readin: " << szTemp << endl;
- //設置用於寫操作的文件描述符
- ev.data.fd=sockfd;
- //設置用於注冊的寫操作事件
- ev.events=EPOLLOUT|EPOLLET;
- //修改sockfd上要處理的事件為EPOLLOUT
- epoll_ctl(epfd,EPOLL_CTL_MOD,sockfd,&ev); /* 修改 */
- }
- else if(events[i].events&EPOLLOUT) // 如果有數據發送
- {
- sockfd = events[i].data.fd;
- szTemp = "Server:" + szTemp + "\n";
- send(sockfd, szTemp.c_str(), szTemp.size(), 0);
- //設置用於讀操作的文件描述符
- ev.data.fd=sockfd;
- //設置用於注冊的讀操作事件
- ev.events=EPOLLIN|EPOLLET;
- //修改sockfd上要處理的事件為EPOLIN
- epoll_ctl(epfd,EPOLL_CTL_MOD,sockfd,&ev); /* 修改 */
- }
- } //(over)處理所發生的所有事件
- } //(over)等待epoll事件的發生
- close(epfd);
- return 0;
- }
