1、開啟curl支持
由於php環境安裝后默認是沒有打開curl支持的,需修改php.ini文件,找到;extension=php_curl.dll,把前面的冒號去掉,重啟服務即可;
2、使用curl進行數據抓取
初始化一個 cURL 對象
$curl = curl_init();
設置你需要抓取的URL
curl_setopt($curl, CURLOPT_URL, 'http://www.kugou.com/yy/html/special.html');
設置header
curl_setopt($curl, CURLOPT_HEADER, 1);
設置cURL 參數,要求結果保存到字符串中還是輸出到屏幕上。
curl_setopt($curl, CURLOPT_RETURNTRANSFER, 1);
運行cURL,請求網頁
$data = curl_exec($curl);
關閉URL請求
curl_close($curl); //print_r($data);
3、通過正則匹配找到關鍵數據
//$data是curl_exec返回的的值,即采集的目標內容
preg_match_all("/<div class=\"top\"><em>(.*)<\/em><strong><a title=\"(.*)\" href=\"(.*)\">.*<\/a>/",$data, $arr); print_r($arr);
最后入庫等處理操作....