python 爬虫newspaper3k 新闻爬去方法利用第三方库

本文转载自查看原文 2018-10-23 10:03 1117

from newspaper import Article


url = '你想要爬取的网站url'
news = Article(url, language='zh')

news .download()  #先下载
news .parse()    #再解析

print(news.text) #新闻正文
print(news.title) #新闻标题
print(news.html)   #未修改的原始HTML
print(news.authors)  #新闻作者
print(news.top_image) #本文的“最佳图像”的URL
print(news.movies)  #本文电影url
print(news.keywords) #新闻关键词
print(news.summary)   #从文章主体txt中生成的摘要
print(news.images) #本文中的所有图像url

免责声明！

本站转载的文章为个人学习借鉴使用，本站对版权不负任何法律责任。如果侵犯了您的隐私权益，请联系本站邮箱yoyou2525@163.com删除。

猜您在找 新闻类爬虫库：Newspaper python爬虫常用第三方库快速下载Python的第三方库，利用镜像【Python&第三方库】安装第三方库xlrd、xlwt的方法利用Python的pip安装第三方库（以pygame为例） Python利用第三方库将csv转为xlsx文件 python第三方库Faker类方法速查三种安装python第三方库的方法解决python第三方库下载慢的方法采用镜像的方法安装python第三方库

python 爬虫newspaper3k 新闻爬去方法 利用第三方库

免责声明！

python 爬虫newspaper3k 新闻爬去方法利用第三方库