PHP学习笔记：通过curl实现采集网站内容

本文转载自查看原文 2016-10-13 10:40 4245 curl采集/ php

　　关于curl，请各位同学自行百度，我直接上案例。

　　首先开启你的curl拓展，在php.ini文件把curl拓展开启，即取消extension=php_curl.dll的分号。

eg:利用curl采集网站内容，并输出到txt文档：

　　目标：抓取本博客首页，并输出到文档

<?php $ch = curl_init("http://www.cnblogs.com/jianqingwang/"); $fp = fopen("example_jianqingwang.txt", "w"); curl_setopt($ch, CURLOPT_FILE, $fp); curl_setopt($ch, CURLOPT_HEADER, 0); curl_exec($ch); curl_close($ch); fclose($fp); ?>

效果：

eg:抓取网站内容，并直接输出

目标：抓取http://www.cnblogs.com/jianqingwang/，并直接输出

<?
// 1. 初始化
$ch = curl_init();
// 2. 设置选项，包括URL
curl_setopt($ch, CURLOPT_URL, "http://www.cnblogs.com/jianqingwang/");
curl_setopt($ch, CURLOPT_RETURNTRANSFER, 0);//改为0就不输出
curl_setopt($ch, CURLOPT_HEADER, 0);
// 3. 执行并获取HTML文档内容
$output = curl_exec($ch);
// 4. 释放curl句柄
curl_close($ch);
?>

效果：

说明：这里界面有点不一样，是因为css和图片地址都是相对路径，所以图片、css都失效了。

eg:

免责声明！

本站转载的文章为个人学习借鉴使用，本站对版权不负任何法律责任。如果侵犯了您的隐私权益，请联系本站邮箱yoyou2525@163.com删除。

猜您在找 如何防止网站内容被采集 PHP - curl实现采集 curl模拟ip和来源进行网站采集的实现方法 Nutch 2.2+MySQL+Solr4.2实现网站内容的抓取和索引 JS实现网站内容的禁止复制和粘贴、另存为 .NET平台上实现网站内容采摘的关键技术 JS实现网站内容的禁止复制和粘贴、另存为什么是网站内容聚合？网站内容聚合页怎么做？ PHP如何采集网站数据解决php无法通过file_get_contents或curl采集页面内容