scrapy 數據存儲mysql

本文轉載自查看原文 2017-05-10 17:29 1531 爬蟲及Scrapy

#spider.py
from scrapy.linkextractors import LinkExtractor
from scrapy.spiders import CrawlSpider, Rule
from Cwpjt.items import CwpjtItem

class FulongSpider(CrawlSpider):
    name = 'fulong'
    allowed_domains = ['sina.com.cn']
    start_urls = ['http://sina.com.cn/']
    'http://news.sina.com.cn/c/2017-05-09/doc-ifyeycte9324112.shtml'
    rules = (
        Rule(LinkExtractor(allow=('.*?/[0-9]{4}.[0-9]{2}.[0-9]{2}.doc-.*?shtml'),allow_domains=('sina.com.cn')),
             callback='parse_item', follow=True),
    )

    def parse_item(self, response):
        i = CwpjtItem()
        i['name']=response.xpath('/html/head/title/text()').extract()
        i['kws'] = response.xpath('/html/head/meta[@name="keywords"]/@content').extract()
        #i['domain_id'] = response.xpath('//input[@id="sid"]/@value').extract()
        #i['name'] = response.xpath('//div[@id="name"]').extract()
        #i['description'] = response.xpath('//div[@id="description"]').extract()
        return i

pipeline

import pymysql
from pymysql import connections
class CwpjtPipeline(object):
    def __init__(self):
        self.conn = pymysql.connect(host='127.0.0.1',user='root',passwd='123456',db ='mydb')
        self.cursor = self.conn.cursor()
    def process_item(self, item, spider):
        name = item['name'][0]
        kws = item['kws'][0]
        sql ="insert into hehe(title,kws) VALUES(%s,%s)"
        self.cursor.execute(sql,(name,kws,))
        self.conn.commit()
        return item
    def close_spider(self,spider):
        self.conn.close()

item

import scrapy


class CwpjtItem(scrapy.Item):
    # define the fields for your item here like:
    name = scrapy.Field()
    kws = scrapy.Field()

免責聲明！

本站轉載的文章為個人學習借鑒使用，本站對版權不負任何法律責任。如果侵犯了您的隱私權益，請聯系本站郵箱yoyou2525@163.com刪除。

猜您在找 scrapy數據存儲在mysql數據庫的兩種方式 scrapy爬蟲結果插入mysql數據庫 Scrapy系列教程（2）------Item（結構化數據存儲結構） scrapy 組合多個頁面的數據一並存儲 mysql之innodb存儲引擎---數據存儲結構 Python scrapy爬蟲數據保存到MySQL數據庫關於ElasticSearch與MySql的數據存儲測試！ MYSQL單表可以存儲多少條數據？？？ mysql如何存儲樹形結構的數據 Scrapy爬取豆瓣圖書數據並寫入MySQL