scrapy使用大坑---meta參數傳遞出現之重復問題
問題描述:
爬蟲目標:
實現嗶哩嗶哩網站的視頻信息爬取,只要的信息結構爬去順序為**關鍵詞的搜索結果,拿到第一頁上某個視頻的標題,url,和時間,然后進入下級頁面爬去該視頻的對應的評論,回復,彈幕,點贊數等等數據,聯合組成一個關於該視頻的完整信息返回item進行后續處理和存儲。
問題點 :
通過meta參數傳值時出現在被調用的函數中meta參數多次重復,廢話不多說代碼貼圖:
爬取結果:(meta傳遞過來的值一直在重復,而response.url的輸出說明網頁的訪問正確,說明智能是meta傳遞值有錯誤)
在網上查閱資料后原因為:(meta的參數傳遞是淺拷貝,並且scrapy是異步框架才會導致這樣的問題)
解決辦法:(改用深拷貝)
修改后效果: