python3使用newspaper快速抓取任何新聞文章正文


newspaper用於爬取各式各樣的新聞網站

1,安裝newspaper

pip install newspaper3k

2,直接上代碼

from newspaper import Article

url
= '你想要爬取的網站url' news = Article(url, language='zh')
news .download() #先下載 news .parse() #再解析
print(news.text) #新聞正文 print(news.title) #新聞標題 print(news.html) #未修改的原始HTML print(news.authors) #新聞作者 print(news.top_image) #本文的“最佳圖像”的URL print(news.movies) #本文電影url print(news.keywords) #新聞關鍵詞 print(news.summary) #從文章主體txt中生成的摘要
print(news.images) #本文中的所有圖像url

 




免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM