PHP - curl實現采集


1、開啟curl支持

由於php環境安裝后默認是沒有打開curl支持的,需修改php.ini文件,找到;extension=php_curl.dll,把前面的冒號去掉,重啟服務即可;

2、使用curl進行數據抓取

 初始化一個 cURL 對象 

$curl = curl_init();

 設置你需要抓取的URL 

curl_setopt($curl, CURLOPT_URL, 'http://www.kugou.com/yy/html/special.html');

 設置header 

curl_setopt($curl, CURLOPT_HEADER, 1);

設置cURL 參數,要求結果保存到字符串中還是輸出到屏幕上。 

curl_setopt($curl, CURLOPT_RETURNTRANSFER, 1);

運行cURL,請求網頁 

$data = curl_exec($curl);

 關閉URL請求 

curl_close($curl);
//print_r($data);

3、通過正則匹配找到關鍵數據

//$data是curl_exec返回的的值,即采集的目標內容 

preg_match_all("/<div class=\"top\"><em>(.*)<\/em><strong><a title=\"(.*)\" href=\"(.*)\">.*<\/a>/",$data, $arr);
print_r($arr);

最后入庫等處理操作....

 


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM