爬取虎牙直播颜值类主播封面图

本文转载自查看原文 2021-01-13 09:50 515

导入包，设置请求头，url地址

使用beatifulsoup解析网页，通过检查可以看到所有图片地址都在属性为class的“pic”中，直接提取。

在这个页面可以看到不止主播封面的图片，还有虎牙直播的logo,二维码等等，所以我们需要精确获取到主播图片的地址

这里就不做保存图片，爬取如下：

代码如下：

import requests
from bs4 import BeautifulSoup

headers = {
    'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/87.0.4280.88 Safari/537.36'
}

url = 'https://www.huya.com/g/2168'
response = requests.get(url, headers=headers).text

soup = BeautifulSoup(response, 'lxml')
# class是关键字 它是声明一个类的所以加下划线
girls = soup.find_all('img', class_='pic')

for girl in girls:
    girl_url = girl['data-original'].split('?')[0]
    girl_title = girl['title']
    print(girl_url, girl_title)

免责声明！

本站转载的文章为个人学习借鉴使用，本站对版权不负任何法律责任。如果侵犯了您的隐私权益，请联系本站邮箱yoyou2525@163.com删除。

猜您在找 虎牙数万主播同时在线直播的秘密，CDN推流日志上行实时监控爬取斗鱼LOL主播人气数据，并显示排行榜 [网络爬虫] [应用案例][请求头][模块] Python实战爬虫——B站封面爬取阿里云直播生成推流和播流地址类爬取昵图网 Python爬虫小白入门（六）爬取披头士乐队历年专辑封面-网易云音乐 python爬取斗鱼B总直播弹幕 python绘制高颜值房价与地铁线路分布图 python：爬取博主的所有文章的链接、标题和内容 Java + golang 爬取B站up主粉丝数