python3使用newspaper快速抓取任何新聞文章正文

本文轉載自查看原文 2018-10-23 11:14 1077 爬蟲

newspaper用於爬取各式各樣的新聞網站

1，安裝newspaper

pip install newspaper3k

2,直接上代碼

from newspaper import Article


url = '你想要爬取的網站url'
news = Article(url, language='zh')

news .download()  #先下載
news .parse()    #再解析

print(news.text) #新聞正文
print(news.title) #新聞標題
print(news.html)   #未修改的原始HTML
print(news.authors)  #新聞作者
print(news.top_image) #本文的“最佳圖像”的URL
print(news.movies)  #本文電影url
print(news.keywords) #新聞關鍵詞
print(news.summary)   #從文章主體txt中生成的摘要
print(news.images) #本文中的所有圖像url

免責聲明！

本站轉載的文章為個人學習借鑒使用，本站對版權不負任何法律責任。如果侵犯了您的隱私權益，請聯系本站郵箱yoyou2525@163.com刪除。

猜您在找 python3.6 使用newspaper庫的Article包來快速抓取網頁的文章或者新聞等正文使用Newspaper3k框架快速抓取文章信息 Python 實現抓取騰訊新聞文章 dede:arclist調用文章正文全部內容 python快速抓取新聞標題及內容按示例學python：使用python抓取網頁正文 github-markdown-css樣式文件-一般用作文章正文的樣式美化 Python3從零開始爬取今日頭條的新聞【二、首頁熱點新聞抓取】新聞類爬蟲庫：Newspaper