scrapy爬虫,cmd中执行日志中显示了爬取的内容,但是运行时隐藏日志后(运行命令后添加--nolog),就没有输出结果了


cmd下执行scrapy爬虫程序,不报错也没有输出,解决方案

 

想要执行parse能够在cmd看到parse函数的执行结果:

解决方法:

settings.py 中设置  ROBOTSTXT_OBEY = False  

 

案例:

   day96\day96\spiders\chouti.py

复制代码
# -*- coding: utf-8 -*-
import scrapy
import sys
import io

sys.stdout = io.TextIOWrapper(sys.stdout.buffer,encoding='gb18030')

class ChoutiSpider(scrapy.Spider):
    name = 'chouti'
    allowed_domains = ['chouti.com']
    start_urls = ['http://dig.chouti.com/']

    def parse(self, response):
        # print(response.url)
        # print(response.text)
        content=str(response.body,encoding='utf-8')
        print(content)
复制代码

day96\day96\settings.py

?
1
ROBOTSTXT_OBEY = False

  

 参考链接:https://bbs.csdn.net/topics/392316454?page=1


免责声明!

本站转载的文章为个人学习借鉴使用,本站对版权不负任何法律责任。如果侵犯了您的隐私权益,请联系本站邮箱yoyou2525@163.com删除。



 
粤ICP备18138465号  © 2018-2025 CODEPRJ.COM