curl ——爬取网页数据

本文转载自查看原文 2019-08-09 16:28 1142 php扩展

使用CURL的PHP扩展完成一个HTTP请求的发送一般有以下几个步骤：

1、初始化连接句柄；

2、配置参数；

3、执行并获取结果；

4、释放CURL连接句柄。

下面是curl模拟get请求，抓取网页内容：

$url="http://book.zongheng.com/chapter/672340/36898237.html";

//1.初始化curl
$ch=curl_init($url);//第一步，我们通过函数curl_init()创建一个新的curl会话
//2.设置传输选项（向服务器端发送请求）

//curl_setopt($ch,CURLOPT_URL,$url);
curl_setopt($ch, CURLOPT_RETURNTRANSFER, true);

//3.执行curl请求（接收服务器端发送的数据）
$output=curl_exec($ch);

//4.关闭curl
curl_close($ch);
//匹配标题            <div class="title_txtbox">第一章 惊蛰</div>
preg_match_all("/<div class=\"title_txtbox\">(.*?)<\/div>/", $output, $title);    
//匹配p标签段落内容    <p>二月二，龙抬头。</p>
preg_match_all("/<p>(.*?)<\/p>/", $output, $match);

//.  是任意字符 可以匹配任何单个字符，
//.*？  表示匹配任意字符到下一个符合条件的字符
$a=$match[0];
echo implode( ' ',$a);

免责声明！

本站转载的文章为个人学习借鉴使用，本站对版权不负任何法律责任。如果侵犯了您的隐私权益，请联系本站邮箱yoyou2525@163.com删除。

猜您在找 如何轻松爬取网页数据？ pycharm爬取网页数据 C# 爬取网页数据 python爬取网页数据 python爬取网页数据方法 nodeJs爬取网页数据 python爬取网页数据使用XPath爬取网页数据 python之爬取网页数据总结（一） python爬取网页数据