Scrapy框架: 登錄網站

本文轉載自查看原文 2019-11-10 11:07 279 爬蟲學習/ Scrapy框架

一、使用cookies登錄網站

import scrapy

class LoginSpider(scrapy.Spider):
    name = 'login'
    allowed_domains = ['xxx.com']
    start_urls = ['https://www.xxx.com/xx/']

    cookies = ""

    def start_requests(self):
        for url in self.start_urls:
            yield scrapy.Request(url, cookies=self.cookies, callback=self.parse)

    def parse(self, response):
        with open("01login.html", "wb") as f:
            f.write(response.body)

二、發送post請求登錄, 要手動解析網頁獲取登錄參數

import scrapy

class LoginSpider(scrapy.Spider):
    name='login_code'
    allowed_domains = ['xxx.com']
    
    #1. 登錄頁面
    start_urls = ['https://www.xxx.com/login/']

    def parse(self, response):
        #2. 代碼登錄
        login_url='https://www.xxx.com/login'

        formdata={
            "username":"xxx",
            "pwd":"xxx",
            "formhash":response.xpath("//input[@id='formhash']/@value").extract_first(),
            "backurl":response.xpath("//input[@id='backurl']/@value").extract_first()
        }

        #3. 發送登錄請求post
        yield scrapy.FormRequest(login_url, formdata=formdata, callback=self.parse_login)
    
    def parse_login(self, response):
        #4.訪問目標頁面
        member_url="https://www.xxx.com/member"
        yield scrapy.Request(member_url, callback=self.parse_member)
    
    def parse_member(self, response):
        with open("02login.html",'wb') as f:
            f.write(response.body)

三、發送post請求登錄, 自動解析網頁獲取登錄參數

import scrapy

class LoginSpider(scrapy.Spider):
    name='login_code2'
    allowed_domains = ['xxx.com']
    
    #1. 登錄頁面
    start_urls = ['https://www.xxx.com/login/']

    def parse(self, response):
        #2. 代碼登錄
        login_url='https://www.xxx.com/login'

        formdata={
            "username":"xxx",
            "pwd":"xxx"
        }

        #3. 發送登錄請求post
        yield scrapy.FormRequest.from_response(
            response,
            formxpath="//*[@id='login_pc']",
            formdata=formdata,
            method="POST", #覆蓋之前的get請求
            callback=self.parse_login
        )
    
    def parse_login(self, response):
        #4.訪問目標頁面
        member_url="https://www.xxx.com/member"
        yield scrapy.Request(member_url, callback=self.parse_member)
    
    def parse_member(self, response):
        with open("03login.html",'wb') as f:
            f.write(response.body)

免責聲明！

本站轉載的文章為個人學習借鑒使用，本站對版權不負任何法律責任。如果侵犯了您的隱私權益，請聯系本站郵箱yoyou2525@163.com刪除。

猜您在找 Learning Scrapy筆記（五）- Scrapy登錄網站 scrapy帶cookie登錄簡單的網站 python網絡爬蟲之使用scrapy自動登錄網站爬蟲Scrapy框架-2爬取網站視頻詳情爬蟲框架之Scrapy——爬取某招聘信息網站 scrapy爬蟲框架爬取招聘網站 scrapy框架下爬取老司機網站獲取磁力鏈接第三百三十三節，web爬蟲講解2—Scrapy框架爬蟲—Scrapy模擬瀏覽器登錄—獲取Scrapy框架Cookies Scrapy框架 Scrapy框架