scrapy--meta參數傳遞問題


 

scrapy使用大坑---meta參數傳遞出現之重復問題

問題描述:

    爬蟲目標:

       實現嗶哩嗶哩網站的視頻信息爬取,只要的信息結構爬去順序為**關鍵詞的搜索結果,拿到第一頁上某個視頻的標題,url,和時間,然后進入下級頁面爬去該視頻的對應的評論,回復,彈幕,點贊數等等數據,聯合組成一個關於該視頻的完整信息返回item進行后續處理和存儲。

              問題點   :

       通過meta參數傳值時出現在被調用的函數中meta參數多次重復,廢話不多說代碼貼圖:

 爬取結果:(meta傳遞過來的值一直在重復,而response.url的輸出說明網頁的訪問正確,說明智能是meta傳遞值有錯誤)

在網上查閱資料后原因為:(meta的參數傳遞是淺拷貝,並且scrapy是異步框架才會導致這樣的問題)

解決辦法:(改用深拷貝)

修改后效果:

 


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM