curl ——爬取網頁數據


使用CURL的PHP擴展完成一個HTTP請求的發送一般有以下幾個步驟:

       1、初始化連接句柄;

       2、 配置參數;

       3、執行並獲取結果;

       4、釋放CURL連接句柄。

下面是curl模擬get請求 ,抓取網頁內容:

     

$url="http://book.zongheng.com/chapter/672340/36898237.html";  

//1.初始化curl
$ch=curl_init($url);//第一步,我們通過函數curl_init()創建一個新的curl會話
//2.設置傳輸選項(向服務器端發送請求)

//curl_setopt($ch,CURLOPT_URL,$url);
curl_setopt($ch, CURLOPT_RETURNTRANSFER, true);

//3.執行curl請求(接收服務器端發送的數據)
$output=curl_exec($ch);

//4.關閉curl
curl_close($ch);
//匹配標題            <div class="title_txtbox">第一章 驚蟄</div>
preg_match_all("/<div class=\"title_txtbox\">(.*?)<\/div>/", $output, $title);    
//匹配p標簽段落內容    <p>二月二,龍抬頭。</p>
preg_match_all("/<p>(.*?)<\/p>/", $output, $match);

//.  是任意字符 可以匹配任何單個字符,
//.*?  表示匹配任意字符到下一個符合條件的字符
$a=$match[0];
echo implode( ' ',$a);  

 

 
打賞

免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2021 CODEPRJ.COM