使用socket發送http請求(GET/POST)
1.socket的原理
在相關文章中已經提及,不再贅述。
delete[] post_content;
2.http頭的格式

(1)請求行
請求行由請求方法字段、URL字段和HTTP協議版本字段3個字段組成,它們用空格分隔。例如,GET /index.html HTTP/1.1。
HTTP協議的請求方法有GET、POST、HEAD、PUT、DELETE、OPTIONS、TRACE、CONNECT。這里介紹最常用的GET方法和POST方法。
GET:當客戶端要從服務器中讀取文檔時,使用GET方法。GET方法要求服務器將URL定位的資源放在響應報文的數據部分,回送給客戶端。使用GET方法時,請求參數和對應的值附加在URL后面,利用一個問號(“?”)代表URL的結尾與請求參數的開始,傳遞參數長度受限制。例如,/index.jsp?id=100&op=bind。
POST:當客戶端給服務器提供信息較多時可以使用POST方法。POST方法將請求參數封裝在HTTP請求數據中,以名稱/值的形式出現,可以傳輸大量數據,可用來傳送文件。
(2)請求頭部
請求頭部由關鍵字/值對組成,每行一對,關鍵字和值用英文冒號“:”分隔。請求頭部通知服務器有關於客戶端請求的信息,典型的請求頭有:
User-Agent:產生請求的瀏覽器類型。
Accept:客戶端可識別的內容類型列表。
Host:請求的主機名,允許多個域名同處一個IP地址,即虛擬主機。
請求行由請求方法字段、URL字段和HTTP協議版本字段3個字段組成,它們用空格分隔。例如,GET /index.html HTTP/1.1。
HTTP協議的請求方法有GET、POST、HEAD、PUT、DELETE、OPTIONS、TRACE、CONNECT。這里介紹最常用的GET方法和POST方法。
GET:當客戶端要從服務器中讀取文檔時,使用GET方法。GET方法要求服務器將URL定位的資源放在響應報文的數據部分,回送給客戶端。使用GET方法時,請求參數和對應的值附加在URL后面,利用一個問號(“?”)代表URL的結尾與請求參數的開始,傳遞參數長度受限制。例如,/index.jsp?id=100&op=bind。
POST:當客戶端給服務器提供信息較多時可以使用POST方法。POST方法將請求參數封裝在HTTP請求數據中,以名稱/值的形式出現,可以傳輸大量數據,可用來傳送文件。
(2)請求頭部
請求頭部由關鍵字/值對組成,每行一對,關鍵字和值用英文冒號“:”分隔。請求頭部通知服務器有關於客戶端請求的信息,典型的請求頭有:
User-Agent:產生請求的瀏覽器類型。
Accept:客戶端可識別的內容類型列表。
Host:請求的主機名,允許多個域名同處一個IP地址,即虛擬主機。
(3)空行
最后一個請求頭之后是一個空行,發送回車符和換行符,通知服務器以下不再有請求頭。
對於一個完整的http請求來說空行是必須的,否則服務器會認為本次請求的數據尚未完全發送到服務器,處於等待狀態。
(4)請求數據
請求數據不在GET方法中使用,而是在POST方法中使用。POST方法適用於需要客戶填寫表單的場合。與請求數據相關的最常使用的請求頭是Content-Type和Content-Length。
最后一個請求頭之后是一個空行,發送回車符和換行符,通知服務器以下不再有請求頭。
對於一個完整的http請求來說空行是必須的,否則服務器會認為本次請求的數據尚未完全發送到服務器,處於等待狀態。
(4)請求數據
請求數據不在GET方法中使用,而是在POST方法中使用。POST方法適用於需要客戶填寫表單的場合。與請求數據相關的最常使用的請求頭是Content-Type和Content-Length。
3.示例程序
int main()
{
int sockfd;
int len;
struct sockaddr_in address;
struct hostent *server;
{
int sockfd;
int len;
struct sockaddr_in address;
struct hostent *server;
int result;
//club.edu.sina.com.cn/bbs/forum-209-1.html
string path("/TJUBBS/bbslogin?id=zongyuan&pw=91117891");
string host("bbs.tju.edu.cn");
stringstream stream;
//GET請求方式
/*
stream<< "GET " << path << " HTTP/1.0\r\n"
<< "Host: " << host << "\r\n"
<<"User-Agent: Mozilla/5.0 (Windows; U; Windows NT 5.1; zh-CN; rv:1.9.2.3) Gecko/20100401 Firefox/3.6.3\r\n"
<<"Connection:close\r\n"
<< "\r\n";
*/
//POST請求方式
char *post_content = new char[128];
memcpy(post_content,"id=*********&pw=*********",128);
int content_length = strlen(post_content);
cout<<"content length is "<<content_length<<endl;
stream<< "POST " << path << " HTTP/1.0\r\n"
<< "Host: " << host << "\r\n"
<<"User-Agent: Mozilla/5.0 (Windows; U; Windows NT 5.1; zh-CN; rv:1.9.2.3) Gecko/20100401 Firefox/3.6.3\r\n"
<<"Content-Type:application/x-www-form-urlencoded\r\n"
<<"Content-Length:"<<content_length<<"\r\n"
<<"Connection:close\r\n"
<< "\r\n"
<<post_content;
//club.edu.sina.com.cn/bbs/forum-209-1.html
string path("/TJUBBS/bbslogin?id=zongyuan&pw=91117891");
string host("bbs.tju.edu.cn");
stringstream stream;
//GET請求方式
/*
stream<< "GET " << path << " HTTP/1.0\r\n"
<< "Host: " << host << "\r\n"
<<"User-Agent: Mozilla/5.0 (Windows; U; Windows NT 5.1; zh-CN; rv:1.9.2.3) Gecko/20100401 Firefox/3.6.3\r\n"
<<"Connection:close\r\n"
<< "\r\n";
*/
//POST請求方式
char *post_content = new char[128];
memcpy(post_content,"id=*********&pw=*********",128);
int content_length = strlen(post_content);
cout<<"content length is "<<content_length<<endl;
stream<< "POST " << path << " HTTP/1.0\r\n"
<< "Host: " << host << "\r\n"
<<"User-Agent: Mozilla/5.0 (Windows; U; Windows NT 5.1; zh-CN; rv:1.9.2.3) Gecko/20100401 Firefox/3.6.3\r\n"
<<"Content-Type:application/x-www-form-urlencoded\r\n"
<<"Content-Length:"<<content_length<<"\r\n"
<<"Connection:close\r\n"
<< "\r\n"
<<post_content;
delete[] post_content;
string request = stream.str();
sockfd = socket(AF_INET,SOCK_STREAM,0);
address.sin_family = AF_INET;
server = gethostbyname(host.c_str());
memcpy((char *)&address.sin_addr.s_addr,(char*)server->h_addr, server->h_length);
address.sin_port = htons(80);
len = sizeof(address);
server = gethostbyname(host.c_str());
memcpy((char *)&address.sin_addr.s_addr,(char*)server->h_addr, server->h_length);
address.sin_port = htons(80);
len = sizeof(address);
result = connect(sockfd,(struct sockaddr *)&address,len);
if(result==-1){
cout<<"connection error!"<<endl;
}
if(result==-1){
cout<<"connection error!"<<endl;
}
write(sockfd,request.c_str(),request.size());
char buf[1024*1024];
memset(buf,0,1024*1024);
int offset = 0;
int rc;
while(rc = read(sockfd,buf+offset,1024)){
offset += rc;
}
close(sockfd);
memset(buf,0,1024*1024);
int offset = 0;
int rc;
while(rc = read(sockfd,buf+offset,1024)){
offset += rc;
}
close(sockfd);
buf[offset] = 0;
// cout<<strlen(buf)<<endl;
cout<<buf<<endl;
// cout<<strlen(buf)<<endl;
cout<<buf<<endl;
/*
int size = offset;
int outlen = 2*size; // 注意編碼轉換之后的字符串長度會發生變化,因此此處定義為2倍長度,確保能夠容納轉換之后得到的字符串
int size = offset;
int outlen = 2*size; // 注意編碼轉換之后的字符串長度會發生變化,因此此處定義為2倍長度,確保能夠容納轉換之后得到的字符串
char *output = new char[outlen];
memset(output,0,outlen);
//進行編碼轉換,將gbk轉換為utf-8
covert("utf-8","gbk",buf,size,output,outlen);
output[outlen] = 0;
covert("utf-8","gbk",buf,size,output,outlen);
output[outlen] = 0;
cout<<strlen(output)<<endl;
// cout<<output<<endl;
delete[] output;
*/
// cout<<output<<endl;
delete[] output;
*/
return 0;
}
}
//使用libiconv庫實現的編碼轉換函數
int covert(char *desc, char *src, char *input, size_t ilen, char *output, size_t olen)
{
char **pin = &input;
char **pout = &output;
iconv_t cd = iconv_open(desc, src);
if (cd == (iconv_t)-1)
{
iconv_close(cd);
return -1;
}
memset(output, 0, olen);
if (iconv(cd, pin, &ilen, pout, &olen)){
cout<<"convert failed!"<<endl;
iconv_close(cd);
return -1;
}
iconv_close(cd);
return 0;
}
4.后續
訪問url時經常發生頁面跳轉的情況,如何能夠適應跳轉,獲取想要的頁面,需要進一步學習。