php建立curl請求的基本步驟:
1.初始化。
2.設置選項,設置URL。
3.執行curl得到結果。
4.釋放curl句柄。
例如
<?php //初始化 $ch = curl_init(); //設置選項 設置url curl_setopt($ch,CURLOPT_URL,'http://www.baidu.com'); //將curl_exec() 獲取的信息以文件流的形式返回 而不是輸出 curl_setopt($ch,CURLOPT_RETURNTRANSFER,1); //啟用是會將頭文件的信息作為數據量輸出 curl_setopt($ch,CURLOPT_HEADER,1); //執行並獲取HTML 內容 $output = curl_exec($ch); //釋放curl句柄 curl_close($ch); echo $output; ?>
運行結果就是打開了使用 curl 獲取了 百度的首頁html 然后 輸出
第二步是最終要的也就是curl_setopt() 這個函數,所有對curl的設置都在這里,通過它可以指定url請求的各個細節。
PHP中CURL方法curl_setopt()函數的一些參數 .
bool curl_setopt (int ch, string option, mixed value)
curl_setopt()函數將為一個CURL會話設置選項。option參數是你想要的設置,value是這個選項給定的值。
下列選項的值將被作為長整形使用(在option參數中指定):
• CURLOPT_INFILESIZE : 當你上傳一個文件到遠程站點,這個選項告訴PHP你上傳文件的大小。
• CURLOPT_VERBOSE : 如果你想CURL報告每一件意外的事情,設置這個選項為一個非零值。
• CURLOPT_HEADER : 如果你想把一個頭包含在輸出中,設置這個選項為一個非零值。
• CURLOPT_NOPROGRESS: 如果你不會PHP為CURL傳輸顯示一個進程條,設置這個選項為一個非零值。注意:PHP自動設置這個選項為非零值,你應該僅僅為了調試的目的來改變這個選項。
• CURLOPT_NOBODY : 如果你不想在輸出中包含body部分,設置這個選項為一個非零值。
• CURLOPT_FAILONERROR : 如果你想讓PHP在發生錯誤(HTTP代碼返回大於等於300)時,不顯示,設置這個選項為一人非零值。默認行為是返回一個正常頁,忽略代碼。
• CURLOPT_UPLOAD: 如果你想讓PHP為上傳做准備,設置這個選項為一個非零值。
• CURLOPT_POST : 如果你想PHP去做一個正規的HTTP POST,設置這個選項為一個非零值。這個POST是普通的 application/x-www-from-urlencoded 類型,多數被HTML表單使用。
• CURLOPT_FTPLISTONLY : 設置這個選項為非零值,PHP將列出FTP的目錄名列表。
• CURLOPT_FTPAPPEND : 設置這個選項為一個非零值,PHP將應用遠程文件代替覆蓋它。
• CURLOPT_NETRC : 設置這個選項為一個非零值,PHP將在你的 ~./netrc 文件中查找你要建立連接的遠程站點的用戶名及密碼。
• CURLOPT_FOLLOWLOCATION : 設置這個選項為一個非零值(象 “Location: “)的頭,服務器會把它當做HTTP頭的一部分發送(注意這是遞歸的,PHP將發送形如 “Location: “的頭)。
• CURLOPT_PUT : 設置這個選項為一個非零值去用HTTP上傳一個文件。要上傳這個文件必須設置CURLOPT_INFILE和CURLOPT_INFILESIZE選項.
• CURLOPT_MUTE : 設置這個選項為一個非零值,PHP對於CURL函數將完全沉默。
• CURLOPT_TIMEOUT : 設置一個長整形數,作為最大延續多少秒。
• CURLOPT_LOW_SPEED_LIMIT: 設置一個長整形數,控制傳送多少字節。
• CURLOPT_LOW_SPEED_TIME : 設置一個長整形數,控制多少秒傳送CURLOPT_LOW_SPEED_LIMIT規定的字節數。
• CURLOPT_RESUME_FROM : 傳遞一個包含字節偏移地址的長整形參數,(你想轉移到的開始表單)。
• CURLOPT_SSLVERSION: 傳遞一個包含SSL版本的長參數。默認PHP將被它自己努力的確定,在更多的安全中你必須手工設置。
• CURLOPT_TIMECONDITION : 傳遞一個長參數,指定怎么處理CURLOPT_TIMEVALUE參數。你可以設置這個參數為TIMECOND_IFMODSINCE 或 TIMECOND_ISUNMODSINCE。這僅用於HTTP。
• CURLOPT_TIMEVALUE : 傳遞一個從1970-1-1開始到現在的秒數。這個時間將被CURLOPT_TIMEVALUE選項作為指定值使用,或被默認TIMECOND_IFMODSINCE使用。
下列選項的值將被作為字符串:
• CURLOPT_URL: 這是你想用PHP取回的URL地址。你也可以在用curl_init()函數初始化時設置這個選項。
• CURLOPT_USERPWD : 傳遞一個形如[username]:[password]風格的字符串,作用PHP去連接。
• CURLOPT_PROXYUSERPWD : 傳遞一個形如[username]:[password] 格式的字符串去連接HTTP代理。
• CURLOPT_RANGE : 傳遞一個你想指定的范圍。它應該是”X-Y”格式,X或Y是被除外的。HTTP傳送同樣支持幾個間隔,用逗句來分隔(X-Y,N-M)。
• CURLOPT_POSTFIELDS : 傳遞一個作為HTTP “POST”操作的所有數據的字符串。
• CURLOPT_REFERER: 在HTTP請求中包含一個”referer”頭的字符串。
• CURLOPT_USERAGENT : 在HTTP請求中包含一個”user-agent”頭的字符串。
• CURLOPT_FTPPORT: 傳遞一個包含被ftp “POST”指令使用的IP地址。這個POST指令告訴遠程服務器去連接我們指定的IP地址。這個字符串可以是一個IP地址,一個主機名,一個網絡界面名(在UNIX下),或是‘-'(使用系統默認IP地址)。
• CURLOPT_COOKIE : 傳遞一個包含HTTP cookie的頭連接。
• CURLOPT_SSLCERT : 傳遞一個包含PEM格式證書的字符串。
• CURLOPT_SSLCERTPASSWD : 傳遞一個包含使用CURLOPT_SSLCERT證書必需的密碼。
• CURLOPT_COOKIEFILE : 傳遞一個包含cookie數據的文件的名字的字符串。這個cookie文件可以是Netscape格式,或是堆存在文件中的HTTP風格的頭。
• CURLOPT_CUSTOMREQUEST : 當進行HTTP請求時,傳遞一個字符被GET或HEAD使用。為進行DELETE或其它操作是有益的,更Pass a string to be used instead of GET or HEAD when doing an HTTP request. This is useful for doing or another, more obscure, HTTP request. 注意: 在確認你的服務器支持命令先不要去這樣做。下列的選項要求一個文件描述(通過使用fopen()函數獲得):
• CURLOPT_FILE: 這個文件將是你放置傳送的輸出文件,默認是STDOUT.
• CURLOPT_INFILE : 這個文件是你傳送過來的輸入文件。
• CURLOPT_WRITEHEADER : 這個文件寫有你輸出的頭部分。
• CURLOPT_STDERR : 這個文件寫有錯誤而不是stderr。用來獲取需要登錄的頁面的例子,當前做法是每次或許都登錄一次,有需要的人再做改進了.
檢查curl的錯誤和獲取還回信息
添加一段檢查錯誤的語句
$output = curl_exec($ch); /* 在判斷是否是 錯誤時用 === 全等於判斷。因為有時候可能得到是一個一個空值 */ if($output === FALSE){ echo 'curl Error:'.curl_error($ch); }
也可以使用curl_getinfo()函數返回curl執行后這一請求相關的信息,這些信息對調試很有作用。
代碼:
curl_exec($ch); $info = curl_getinfo($ch); echo '獲取'.$info['url'].'耗時'.$info['total_time'].'秒';
返回的數組元素列表:
[url] => http://www.baidu.com/ //資源網絡地址
[content_type] => text/html // 內容編碼
[http_code] => 200 //http 狀態碼
[header_size] => 750 //header 大小
[request_size] => 52 //請求大小
[filetime] => -1 //文件創建時間
[ssl_verify_result] => 0 //ssl 驗證結果
[redirect_count] => 0 //跳轉次數
[total_time] => 0.053938 //耗時
[namelookup_time] => 0.030599 //dns 查詢時間
[connect_time] => 0.039183 //連接時間
[pretransfer_time] => 0.039279 //准備傳輸耗時
[size_upload] => 0 //上傳數據大小
[size_download] => 14613 //下載數據大小
[speed_download] => 270922 //下載數度
[speed_upload] => 0 //下載數度
[download_content_length] => 14613 //下載內容長度
[upload_content_length] => 0 //上傳數據長度
[starttransfer_time] => 0.044657 //開始傳輸耗時
[redirect_time] => 0 //重定向耗時
[redirect_url] => //重定向地址
[primary_ip] => 220.181.111.188 //目標端ip
[certinfo] => Array() //認證信息
[primary_port] => 80 //端口
[local_ip] => 192.168.199.115 //本地ip
[local_port] => 50450 //本地端口
案例1抓取圖片:
<?php @header('Content-type:image/png'); //初始化 $ch = curl_init(); //設置選項 curl_setopt($ch,CURLOPT_URL,'http://www.php.cn/tpl/Index/Static/css/img/common/logo.png'); curl_setopt($ch,CURLOPT_RETURNTRANSFER,1); curl_setopt($ch,CURLOPT_HEADER,0); $output = curl_exec($ch); $info = curl_getinfo($ch); curl_close($ch); file_put_contents('./a.png',$output); $size = filesize('./a.png'); if($size != $info['size_download']){ echo "下載數據不完整"; }else{ echo "下載數據完整"; } ?>
查看當前目錄下是否有a.png圖片
案例2偽造信息頭:
每個http請求都包含信息頭,它是服務器和客戶端的身份證明和交流方式。現在通過curl 模擬手機登陸3g.qq.com
首先在PC端訪問3g.qq.com,會制動轉跳到3gqq.com,這就是騰訊識別到我們的信息頭來自PC端瀏覽器。
想要實現手機訪問效果就要用curl 模擬手機UA訪問它
<?php
@header('Content-type;text/html;charset=utf-8');
$ch=curl_init();
curl_setopt($ch,CURLOPT_URL,'http://3g.qq.com');
curl_setopt($ch,CURLOPT_RETURNTRANSFER,1);
$sh=[
'HTTP_VIA:HTTP/1.1 SNXA-PX-WAP-GW21 (infoX-WISG,Huawei Technologies)',
'HTTP_ACCEPT:application/vnd.wap.wmlscriptc,text/vnd.wap.wml,application.vnd.wap.xhtml+xml,application/xhtml+xml,text/html,multipart/mixed,*/*',
'HTTP_ACCEPT_CHARSET:ISO-8859-1,US-ASCII,UTF-8;Q=0.8,ISO-8859-15;Q=0.8,ISO-10646-UCS-2;Q=0.6,UTF-16;Q=0.6'
];
curl_setopt($ch,CURLOPT_HTTPHEADER,$sh);
$output=curl_exec($ch);
curl_close($sh);
//第二次跳轉
$ch = curl_init();
curl_setopt($ch,CURLOPT_URL,'http://info.3g.qq.com/g/s?aid=index&g_f=1283&i_f=1335&&&i_f=1335&_qweti=q_1480587101703');
curl_setopt($ch,CURLOPT_RETURNTRANSFER,1);
curl_setopt($ch,CURLOPT_HTTPHEADER,$sh);
$output=curl_exec($ch);
curl_close($ch);
echo $output
?>
運行結果:
案例3使用curl發送post數據:
GET方式發送數據只需要在url后面添加參數就可以了。POST方式發送需要通過HTTP請求體發送。
1.建立一個接收端 用來接收 POST 數據。
<?php
print_r($_POST);
?>
2.寫一個通過curl發送POST數據的頁面
<?php $url='http://admin.com/getPost.php'; $data=[ 'id'=>'1', 'name'=>'heheda', 'age'=>'26' ]; $ch=curl_init(); curl_setopt($ch,CURLOPT_URL,$url); curl_setopt($ch,CURLOPT_RETURNTRANSFER,1); //設置為post curl_setopt($ch,CURLOPT_POST,1); //設置post 傳遞的數據 curl_setopt($ch,CURLOPT_POSTFIELDS,$data); $output = curl_exec($ch); curl_close($ch); print_r($output); ?>
運行結果:
案例4使用curl上傳文件:
上傳文件和 POST提交數據差不多。
1.建立一個接收端用來接收文件
<?php
print_r($_FILES);
?>
2.curl 上傳腳本
<?php //設置上傳路徑 $url = 'http://admin.com/upload.php'; $ch = curl_init(); //判斷php版本 if (class_exists('CURLFile')) { //>= 5.5.0 $data = [ "foo" => "bar", "upload" => new CURLFile('./1.png', 'image/png', 'testpic') ]; } else { $data = [ "foo" => "bar", "upload" => "@/mnt/hgfs/F/web/newomcat/admin/l.png" ]; } curl_setopt($ch, CURLOPT_URL, $url); curl_setopt($ch, CURLOPT_RETURNTRANSFER, 1); curl_setopt($ch, CURLOPT_POST, 1); curl_setopt($ch, CURLOPT_POSTFIELDS, $data); $output = curl_exec($ch); //檢查錯誤 if ($output === false) { echo curl_error($ch); } curl_close($ch); echo $output; ?>
運行結果:
案例5使用curl批處理:
curl有一個高級特性--批處理句柄(handle)。這個特性可以同時或者異步的打開多個curl連接。
<?php
//創建兩個curl
$ch1 = curl_init();
$ch2 = curl_init();
//指定url和參數
curl_setopt($ch1,CURLOPT_URL,'http://www.baidu.com');
curl_setopt($ch1,CURLOPT_RETURNTRANSFER,1);
curl_setopt($ch2,CURLOPT_URL,'http://news.baidu.com/');
curl_setopt($ch2,CURLOPT_RETURNTRANSFER,1);
//創建curl批處理句柄
$mh=curl_multi_init();
//加上前面兩個資源句柄
curl_multi_add_handle($mh,$ch1);
curl_multi_add_handle($mh,$ch2);
//預定義一個狀態變量
$active=null;
//執行批處理
do{
$mrc=curl_multi_exec($mh,$active);
usleep(10000);
}while($active>0);
$res[1]=curl_multi_getcontent($ch1);
$res[2]=curl_multi_getcontent($ch2);
//關閉各個病句
curl_multi_remove_handle($mh,$ch1);
curl_multi_remove_handle($mh,$ch2);
curl_multi_close($mh);
print_r($res);
?>
結果就是同時讀取到了百度首頁和百度新聞首頁!