開發scrapy web界面（一）

本文轉載自查看原文 2020-02-02 16:16 257

scrapy 是一個很強大的爬蟲框架，可以自定義很多插件，滿足我們不同的需求....

首先我們應該要會用twisted 寫web service

其實scrapy 已經幫我們做了整理了

from scrapy.utils.reactor import listen_tcp

listen_tcp就可以開啟web service

所以web 插件可以這樣寫


class WebService(server.Site):
    name = 'WebService'
    def __init__(self, crawler):
        self.crawler = crawler
        self.crawler.itemData = []
        
        portal = Portal(PublicHTMLRealm(Root(self.crawler)),
                        [StringCredentialsChecker('test', 'tset')])
        credential_factory = BasicCredentialFactory("Auth")
        resource = HTTPAuthSessionWrapper(portal, [credential_factory])
        
        server.Site.__init__(self,resource)

        self.crawler.signals.connect(self.start_listening, signals.engine_started)
        self.crawler.signals.connect(self.stopService, signals.engine_stopped)
        self.crawler.signals.connect(self.item_scraped, signals.item_scraped)
        self.crawler.signals.connect(self.spider_idle, signal=signals.spider_idle)

    @classmethod
    def from_crawler(cls, crawler):
        return cls(crawler)

    def start_listening(self):
        self.port = listen_tcp([8000,8070], '127.0.0.1',self)
        h = self.port.getHost()
        logger.info("scrapy web console available at http://%(host)s:%(port)d",
                    {'host': h.host, 'port': h.port},
                    extra={'crawler': self.crawler})
        import webbrowser
        webbrowser.open("http://%(host)s:%(port)d"%{'host': h.host, 'port': h.port})

    def stopService(self):
        self.port.stopListening()

    def item_scraped(self,item, response, spider):
        try:
            self.crawler.itemData.append(item)
        except:
            pass
    
    def spider_idle(self):
        raise DontCloseSpider

然后界面可以在Root里實現。

以下是實現的界面

可以添加控制爬蟲的一些操作，如爬蟲暫停、添加開始爬的內容等

當然、還可以做一些調試的界面或是其他有趣的

免責聲明！

本站轉載的文章為個人學習借鑒使用，本站對版權不負任何法律責任。如果侵犯了您的隱私權益，請聯系本站郵箱yoyou2525@163.com刪除。

猜您在找 OpenWRT - WEB界面開發思路和基本方法【Python】+web應用開發/界面/Django/Flask 基於雲開發開發 Web 應用（二）：界面 UI 開發 Scrapy開發 HTML5移動Web開發（七）——通過界面圖標啟動Web應用 java web開發登錄界面（連接數據庫）第8章 scrapy進階開發(1) 第8章 scrapy進階開發(2) 基於MVC4+EasyUI的Web開發框架經驗總結（2）- 使用EasyUI的樹控件構建Web界面關於java web開發需要哪些技術要求（簡單的web界面管理系統）